概述
HDFS是Hadoop中进行分布式存储的组件,旨在提供可靠的, 可扩展的, 高吞吐, 高并发的大数据访问....因为大量的小文件产生大量NameNode的metadata, 从而影响NameNode性能
更多支持OLAP系统, 不保证快速访问
不支持事务
image.png
HDFS技术要点
Block
Block...是HDFS的基本存储单位, HDFS会将数据进行切块存储, 默认128M(Hadoop2.0)....Metadata的存储位置决定于core-site.xml中的hadoop.tmp.dir....回收站机制
默认情况下在HDFS上删除的文件无法找回, 利用回收站机制, 可以配置文件在HDFS的停留时间.