温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,那从今天开始我们看这个。啊,看这个h base,那总共呢,应该是三天半到四天的一个时间啊,三天半多一点时间啊,就是这个样子,总共的一个时间是这样的,好,那我们看一下这个h base整体的一个安排,要学哪些东西,对吧,还是一样的,折叠一下第一张呢,是它的一个简介。啊,但这块呢,这个简介里面会讲它的一个架构,但是呢,在简介里面我们只是讲一个基础架构,因为就爱这个东西来说,是大家整个离线框架里边最难的一个框架。里面的细节特别多啊,里面那个细节特别多,我现在把复杂结构之前,我是直接在第一章里面就讲那个复杂结构,发现呃,吸收效果不太好,然后呢,在第一章改一下,就讲一个简单的架构,让大家一步一步的去理解,还有一个复杂结构在哪呢?在进阶里。在这块啊,我把那张图拿到后面去了啊,拿到后面主是这意思啊,那第二款快速入门安装并使用啊,它也可以通过命令行去操作,但是呢,其实在命令行操作呢,比较少一点啊,比较少一点,因为命令行里面更多的我们是增加改查一条数据一条数据的,对吧?查呢也只是做打印,而h base这个东西呢,未来在生产环境当中是要存十几亿条几十亿条数据这个地方。
01:20
你说在命令行里面,你去扫描一下,你那个就停不了了,所以命令行里边呢,更多的是做一个测试,它一定是在API里面去用的。啊,API里用的,你要过滤出来什么数据啊,好,这个是我们所说的这个入门这块啊,要安装并使用啊,今天我们应该能把这块呃讲掉肯定是没问题的,好,第三章进阶这块呢,就是它这个原理架构读写。啊,读写流程啊,除了读写流程之外呢,还有其他的,还有什么flash,还有一个comp。合并还有一个split,它比其他的内容呢要多一些。啊,这个里面就很奇怪,对吧,这两个东西是不是矛盾的呀。
02:04
一个是合并,一个是什么?切割对吧,在h base当中呢,你就会发现它正常的工作过程当中啊,如果生产环境当中,你会发现H辈子里边那个对应的那个表的东西啊,合久必分,分久必合。就一段时间合一下,合大了呢又分掉分,分小了呢又合。对吧,就是和分和分一直在不断的发生,这个过程一直在发生啊,所以说这两个过程在H倍当中是有一个重要的一个点,但是这个呢,不是你要求你人工操作,虽然你可以人工操作,但是不要求人工操作啊,不要求人工操作能理解啊好,正方呢是API,这个呢也是咱们一个重点API内容啊,里边的一个重点,这后挡是HP的一个优化,优化对于h base来说还好啊还好啊,这块呢还好,不像那个什么我们所说的have呀,哈杜呀,还有未来要学的Spark在面试过程当中是必问的,Base的优化点还好啊,中间有一个点是需要大家去掌握的,因为当中呢,你会发现我们统计了一下,十道变试题当中有八道是一样的。
03:11
有八道是一样的,基本上就关于啊,这辈子就喜欢问那个题。啊,基本上就是这个点啊,七八道是一样的啊,基本上是这个点啊。之后呢,类似于那个汉当中,我们最后做了一个鼓励一这边呢有个鼓励微博。对吧,啊,鼓励微博其实就是仿的那个什么微博的那种架构里边去去存储数据的啊,存储数据的之前鼓励引擎不是那个YouTube b的数据嘛,对吧?啊这个里面呢,就自己造一些数据啊,仿仿仿照一下这个微博的它整个的一个底层到底是怎么做的啊,怎么做的是这个意思,就是整个的我们要学的内容,其实最核心的点就在于这块。啊,最核心的点就在这块,大家关注一下就三次原理和API啊,这个什么shell当中,这里边会讲那个命令行那个操作,对吧,是要的一个操作,这个呢,测试的时候是咱们一个重点内容,但是其实生产环境当中,这块用的相对来说比较少一点啊,比较少一点,这个是我们总体做的一个介绍。
我来说两句