近日,Apache Hadoop 3.3.0版本正式发布,增加对腾讯云对象存储COS的支持。
Apache Hadoop 3.3.0是2020年Apache Hadoop 3.3系列的第一个版本,包含许多重要特性和增强功能,部分列举如下:
Hadoop是目前应用最为广泛的分布式大数据处理框架,也是大数据处理领域事实上的标准。
大数据分析需要花费大量的计算和存储资源。在传统模式下,计算与存储资源耦合度较高,一旦资源不够,就需要对二者同时进行扩容。近年来,在云计算的推动下,开发者逐渐开始采用云上对象存储,来实现计算与存储的分离,进而提升资源的灵活性,并降低成本。
此次Hadoop新版本正式支持腾讯云对象存储COS,意味着后续开发者在基于Hadoop架构进行大数据分析时,能够在不修改代码的情况下,无缝高效地使用腾讯云COS来处理海量数据读写任务。这在一定程度上标志着腾讯云对象存储技术受到了Hadoop开源社区的认可。
腾讯云对象存储COS底层采用腾讯自研存储引擎YottaStore,能够实现单集群理论管理百万级节点和按需扩容,磁盘利用率达到 90% 以上。
“开发者在腾讯云上可以使用弹性 MapReduce(EMR)计算,并直接使用腾讯云对象存储COS作为后端存储,整个过程都不需要额外添加代码,更加方便和快捷。”腾讯云对象存储负责人介绍。
目前,小红书、猎豹移动、珍爱网等公司都使用腾讯云“EMR on COS”的计算与存储分离模式来快速构建和部署大数据分析程序,以满足企业大数据业务需求。
领取专属 10元无门槛券
私享最新 技术干货