云计算分布式框架 Hadoop

107课时
2.2K学过
8分

课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
3分钟

Hadoop的组成

Hadoop主要的两部分分别是分布式存储HDFS和分布式计算MapReduce。HDFS是一个master/slave的结构,就一般部署来说,在master上只运行一个NameNode,而在每一个slave上运行一个DataNode。MapReduce是一个编程模型,用以进行大数据量的计算。MapReduce的名字源于这个模型中的两项核心操作:Map和Reduce。Map是把一组数据一对一地映射为另外一组数据,Reduce是对一组数据进行归约。映射和归约的规则都由一个函数指定。HDFS和MapReduce将在后面章节中详细介绍。