本篇博客小菌为大家带来关于HBase的预分区的内容分享!
在正式开始介绍之前,我们先联系一下之前所学的内容 , 想想原本数据分区(分region)的过程是怎样的?...现在我们需要进行优化,那如何优化呢,这里有一个方案: 将一个10G的数据打散,尽量多的,尽量均匀的分散到不同的regionserver上。
那到底如何实现上述方案呢?...这里我们就需要用到预分区(region)预先设置每个region 的startkey和endkey。
好了接下来正式进入到正文!
1、为何要预分区?...每一个region维护着startRow与endRowKey,如果加入的数据符合某个region维护的rowKey范围,则该数据交给这个region维护。
3.如何设定预分区?...byte[][] splitKeys = {{1,2,3,4,5},{'a','b','c','d','e'}};
//通过HTableDescriptor来实现我们表的参数设置