云计算分布式框架 Hadoop

107课时
2.2K学过
8分

课程评价 (0)

请对课程作出评价:
0/300

学员评价

暂无精选评价
5分钟

HBase的数据管理

HBase(Hadoop Database)是一个分布式的、面向列的开源数据库。HBase是Apache的Hadoop项目的子项目。HBase不同于一般的关系数据库,它是一个适合于非结构化数据存储的数据库。HBase基于列而不是基于行。总体来说,HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

Hbase的大部分特性和Bigtable类似,HBase是一个稀疏的、长期存储的(存在硬盘上)、多维度的排序映射表,这张表包括了行关键字、列关键字和时间戳。每个值都是一个字符型数组,数据都是字符串,没有类型。在HBase中存储数据,每一行的数据都有一个可排序的主键和任意多个列。采用稀疏存储,所以同一张表里的每一行数据都可以有截然不同的列,列名、族名的格式是“<family>:<label>”,由字符串组成,每一张表有一个family集合,这个集合是固定不变的,相当于表的结构,只能通过改变表结构来改变表的family集合,但是label值相对于每一行来说都是可以改变的。