云计算分布式框架 Hadoop

107课时
2.2K学过
8分

课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
5分钟

Hadoop简介

一台计算机处理一批数据需要30小时,如处理地震预测数据、天气预报的数据,这样的计算速度实在太慢了。提升单台计算机速度是过去的办法,慢慢走到了极端,CPU的速度不可能再大幅度提升了。人们一直希望通过增加计算机数量提高运算和数据处理速度,如希望通过同时在300台计算机上处理数据,让处理这批数据的速度变成0.1小时。当然,这是一种理想状态,实际上,人们已经开始设计这样的分布式系统,通过使众多的计算机通过集群方式并行同时运行来提高数据处理速度。

Hadoop是一个分布式计算框架,它能在由大量廉价的硬件设备组成的集群上运行应用程序,并为应用程序提供一组既稳定又可靠的接口,Hadoop计算框架的目的是构建一个具有高可靠性和良好扩展性的分布式操作系统。随着云计算的逐渐流行,这一项目被越来越多的个人和企业运用。