云计算分布式框架 Hadoop

107课时
2.2K学过
8分

课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
3分钟

Hadoop的定义

Hadoop是一个分布式处理的软件框架,它实现了像MapReduce一样的编程模式和框架,能在由大量计算机组成的集群中运行海量数据并进行分布式计算,它处理的海量数据能达到PB级别(1PB= 1000TB)并可以让应用程序在上千个节点中进行分布式处理,处理的方式是可靠的、高效的,并有可伸缩特性。Hadoop是可靠的,如果计算元素或存储数据失败,它可以启动和维护多个工作数据副本,确保失败的节点重新对数据进行分布式处理;Hadoop是高效的,它的工作方式是并行的,采用这种方式可以加快数据处理速度;Hadoop是可伸缩的,可以处理不同级别的数据,大到能够处理PB级别的数据。除此以外,Hadoop依赖于社区服务器,所以成本很低,任何人都可以放心、舒畅地使用它,而不需要过多地考虑费用问题。