00:01
好,那接下来我们看一看这个R的一个设计,那A分区假如说建立好了就是这个内容。那你rookie是不是想设计完了之后能够尽量均匀的散落在某个分区里面?对吧,最好的方式是不是轮询进去,但轮询有个不好的点,就是它不好找这个数据,因为前面轮询的你这条数据将来来了,也不知道在哪个分区了,它不好读,所以呢,我们要考虑几个条件,那其实我们刚才所说的尽量均匀的。分布的。多个分区里边,这个其实讲的是它的一个散裂性。讲的是它的一个散裂性。能理解这个事。散裂性,因为希望均匀的散裂到不同的分区里边了啊是第一个好,第二个原则,设计原则,就是我们之前提过的,它有一个原则叫唯一性。
01:02
这个其实不用聊了吧,啊,表里边它就是根据rie来判断这个是一条数据还是两条数据的,对吧?啊,你得唯一第三个就是我们所聊的长度原则。那你要保证唯一性,你应该还有个什么长度的一个规定吧,生长环境当中一般是70~100倍。就是说可以70~100倍,因为他要未来保证几十一条数对吧,所以说70~100倍啊,70~100倍我们升级的时候跟之前用的时可是不是1001啊啊在生长上不是的,一般70~100倍,70~100这个意思啊,整个K是非常长的啊,70~100倍这个基本上是它的一个规则,好那rookie从原则性方面呢,就是这三个东西,大家这三个东西要记住的记住,因为你在笔试题的时候,如果笔试题问到这个。H base的话一般就是这种,他会问h rie的一个设计原则。啊,就答这三个点就行了,好,面试题当中他会给你抛一个场景,说我们公司当中遇到的。
02:06
目前遇到这样的问题,对吧,我将来希望查什么样的数据,然后呢,希望你帮我来设计一个什么OK。那你首先要规划好它这个分区,预分区,能领导他说你设计肉的时候,你要分预分区,如果说你整个。表只有一个分区,有省略性可言吗?你怎么哈希你说可以设计的再漂亮,扔进去再一个分区吧,啊,散裂性是一定要跟多个分区结合在一块用的,能理解这个是吧?啊这第一个第二个微信我们不聊了,第三个是常规原则,这三个原则要记得住啊,那接下来我们重点最重要的其实大家感觉到是什么。是不散电信,因为这两个东西是一定要保证的了,微信你一定要玩的成原则,你保证微信是不是一定要这个rookie比较位数比较高的时候才有希望啊啊才有希望,好,那我们就看一下他如何来做他的一个闪电。
03:05
啊,其实做散裂啊,最好的方式就是轮许我们对吧,来一个第一条数据来了,我前面拼接一个AA,第二条数据来了,我前面拼接一个BB,就是开头以BB开头对吧,然后加一个什么内容,然后。CCDD等等。这些动物。没问题吧,啊,以这个来开头啊,以这个来开头啊,但是有一个问题,如果说我们用轮选的方式,你将来拿数据的时候,拿数据的时候,你能通过Rose这种方式来拿数据。因为你最后你自己都不知道关于这条数据,它前面拼的是什么内容了,那你还能限定start Rose double就不知道了,对吧?所以呢,这个东西啊,还是应该跟我们实际的数据相关啊,假如说举个例子,有一些数据我们是不是经常在一块要读的。
04:02
那这种数据我们是不是应尽量的把它放到一个分区里边,最后而且放在一个分区里边,还是要连续的放在一块吧,因为这样我们经常读的数据才能用start stop肉给它一块拿出来,对不对?如果说你经常读一块读的数据,你第一个分区一个,第二个分区一个,第三个分区一个,第四个分区一个,你能用Rose吗?不能因为你要看啊。Abcd你现在要想从A跟D这两个分区里面拿数据。你能用。A。D这个方式来拿,这个方式一拿,BC的所有数据是不是全出。是不是包含了BC所有的数据啊,对吧,你一定不能采用这种方式来拿了,所以这个问题啊,在考虑散裂的同时,我们还要要考虑数据的集中性。这两个是矛盾的。因为你一方面要把它散裂,另一方面要把它集中,对吧,集中我们走会来聊,先我们看一下这个散裂整个的一个方法有哪些,因为这个东西啊,就就光这样说,说明白了,我后面会结合一个案例,单独的开一个视频来聊这个事儿啊,来聊这那好,那我们要考虑他的一个散电信,因为要考虑那个集中性的时候,一定跟业务相关,因为业务决定你将来什么数据在一块读,对不对。
05:24
没问题吧,因为业务决定了你将来数据,什么数据在一块读。OK了啊,所以跟业务相关,现在没有业务,我们谈不了这个集中性,现在我们就看看这个散裂性,散裂性比较简单,生成随机数啊,哈希啊,散列值啊,还有那个MD5算法呀,什么异货呀,囤货啊,这种东西都可以。都可以OK,那下来第二个字符的反转,特别时间戳反转特别有用,时间顺着是不是特别有规律啊,按顺序的吧,反过来呢。没规律啊,一点没规律了,那其实你整个的散裂不就叫它没规律吗。有规律,它不是按顺序来的嘛,对吧?啊,要的就是没规律尽量的散啊,或者说字符串拼接啊,乱七八糟拼接在一块儿啊,这个意思,这是我们所说的散裂的几种方式,就是说你想选定了什么值之后,然后呢,你要按照这个值再进行一个哈希或者散列。
06:18
啊,是这种方式来做的,这是我们所说的散裂的一个方法啊方法,但是我们还没有具体的聊,如何来决定这个散裂啊,如何用考虑它这个集中性啊,我把这个视频来截一下啊,这。
我来说两句