00:00
没有执行吗?这是什么意思呢?是这样的,我们看不进来select的心from这样啊,我先心from这个什么test,我们是不是只有目前只有这一张表啊。好,这个1123,然后接下来呢,我们在来count心。From。这是当时我们发现了一个奇怪的一个现象,对吧?啊,我这个表重建了啊,因为我们当时我我那个昨天做一些测试啊,呃,那之前我们看到更奇怪是个零,还记得吗?有人你问印象吗?对吧,当时这个零这个就是一了,因为这张表重现了,我们需要去大家说一下为什么这个地方这种现象啊来呃,大家还记得我们当时这张表啊,是怎么建的,先把T放一放,我们先还原一下之前的一个稍微的场景,假如呢,可粒的table。
01:21
然后我叫TEST1这张表啊,然后呢,还用ID,就是说保持这些东西干什么,保持一致对吧?表明总不会有影响吧,说你用123会对我这个S影响,那这个就封了对吧,那还不就没法用了,我最后这一个circle还跟你的表明有关系,是不是没法用了呀,对吧?好,那当时呢,我们是不是音色了一条数据,这做12Y64括号这个地方呢,我放一个1001。这个正常的呢,他会写入数据进去。
02:05
嗯。他其我当时说跟后面有个配置有关系对吧?呃,这个配置一般我们也不会去关它,因为它会避免掉我们走mmr任务啊,因为看到新我们发现是不是不走MR呀,不走MR是不是效率怎么样,明显肯定会高一些,对不对啊啊,它那个是有一个类似于开关一样东西,它可以设置什么情况下我可以不走mmr啊后面呢,我们也能遇得到一般的情况下啊,就是说能不走mmr的我们肯定不走MR啊好,那这个呢,写进去了,写进去之后呢,我们c select的心from这个TEST1这张表对吧,肯定1001,这个没有问题对吧,因为c select的心我们从来没有遇到过问题,他都是把我们数据有多少就拿多少了,那这个时候靠的心呢。
03:01
是一,而且不走MR任务对吧?需要跟大家解释一下,为什么他不走MR任务来打开我们的原数据,它不走MR任务还能查到有多少条?那走的其实就是啊,原数据表当中,呃,首先呢,我们找到,因为我之前测试过东西啊,所以说这个表ID已经到21了,那比较高了,因为我中间有的表删掉了啊好,这个是T1,这张表给家看一下是不是T1啊,没有问题吧,好记住21啊,然后呢,我们点到这个叫table。参数对吧,点开点开好以后,这个就是叫TDD21。这不就是刚才我们看A那张表吗?对吧,那这张表当中呢,它就有一个什么东西来看这啊看这个属性。
04:00
这个叫什么number行数,其实它所谓的不走呢,就主在这。啊,走的这个地方呢一对吧,这个能理解,因为你的原数据信息当中已经有了函数,我看看新不就是几步函数吗?我还需要走mmr去找HD这个数据吗?不需要了,对吧,我直接拿过来,但是问题就在于刚才我们看到的,明明现在的新看到四条数据,最后不是就是现在的新看到四条数据,但是。空的心一是不是,甚至那天我们看到还有个零这种情况是不是,那这种情况又是怎么发生的呢?来看,还记得当时我们第二个文件怎么往里放的,还记得吗?我直接往里put的,对吧?那你觉得我在这个地方用哈命令去put,它会修改原数据吗?我用哈杜命令去put哇,IDF put1张数据,它会修改原数据,大家想一下不会修改元数据,肯定是你通过一个哈命令吧,能理解这事,那我们来看一下,恢复下这个现象,他多把S呃,这个ID我先给他看一下这个I吧,这样啊,这个是之前做测试的,我还是恢复一下ID这个中间呢,这个东西给看这101有了,我就放两个看了一下d.a点零没有问题吧,好,然后我把这个上去啊put ID put得到哪啊,是不是看一那个目录底下了,对吧,那我们去写一下啊。
05:46
这个当时我没改啊,我想了一下,我因为机器已经启动过了,我就改它的端口号,我在想是不是会整个机器会出问题,所以我当时想了一下就没改啊,当时候我在在用到这个端口号的时候,我会提醒大家一下,大家的都是8020对吧?啊8020要注意一下,就以后看到或者说很简单的一个视频啊,你把文档当中你去搜一下9820。
06:12
然后把这里边东西做一个什么,对,这个地方在在这地方啊,可以做一个什么替换,你把所有东西啊,文档当中我提前给它替换成方形奥里,那你以后再粘文档的时么时候就不会有问题了,对吧?啊把这事情做一下啊好,这是我们看到当我们要的路径的,就是它这个里边其实就刚才放在1001对吧?好,那我们把这个路径拿过来啊,放在这个目路底下,我们就刷新现在id.TST这里面放的是10021003对吧,但是这个时候来看原数据啊,还是这个东西对吧,然后我们刷新。原数据有变吗?包括底下你看这个地方都没变,这个叫什么叫文件数,就算你放进去,我不去遍历文件,说number Rose不变很正常,连文件数都没变,因为你put命令压根就不会去修改原数据。
07:12
对吧,而那这个时候正常的我们去c select的心,C select的心它是不是查询所有数据啊,123没问题吧,但是这个时候看的心呢。还是一,因为他走在哪啊,这就这个地方对吧,这个地方好,那么问题来了,我们之前是不是还有个零啊,这种现象比这个一奇怪多一这个地方应该大家能理解了吧,它怎么回事,因为它走的原数据对吧,那零又是怎么回事呢?你是这样的来看啊,我们创建一个,我先给他创建一个表,我再给他创建一个表,来一个二。
08:00
二创建好了对吧,刷新这个时候它的什么,刚创建的肯定两个都是零嘛,文件数和这个number都是零,那如果说这个时候我往里面铺的数据,你说查询结果应该是多少零,那些同学大家想的不对啊,你最早的这个test好像insert过数据啊。会干,但是你要注意我们执行在test里面执行in色的是不是用的德比数据库。是不是,所以那个一确实有,但是它是放在哪的多米数据库的,我们切到马斯克好以后,是不是在马斯克里边简简单单的就建了一张表。对吧,然后往这张表里边用put一个数据嘛,对吧,是不是做了这样的事情啊,所以你刚建表建好表的时候,是不是就是什么零啊啊就相当于我们当时那个太是什么情况呢?是建好表之后往里面放了两个文件有什么区别?
09:07
能明白这个意思,就是说当时我们的现象是这样子的,我们创建表,CREATE1张表对吧?创建一张表,那创建表好以后,我们是不是又用了一色的这个命令对吧?正常而言,它是不是应该在原数据里面会记录有一个文件,有一行数据没问题吧,但是这个东西在哪?在德比对吧?当时最早的时候我们是不是拿德做测试的。对吧,最早的时候啊,好,那之后又做了一个事情,把德比替换成了my circle,然后又去干什么创建表了。对吧?呃,Ipdfs那个文件还在,我们又是装题表了,这个时候C的心是不是能查到数据啊,对吧?这个也得给大家解释了啊,当时为了解决这个问题,还用了库命令嘛啊解释说原数据和数据本身这两个东西呢,呃,不需要非得说同时哪个先零后,这个没关系,只要两个都存在就能查得到,对吧?所以用库的也能够去查得到数据啊,但是这个时候它创建的表是不是创建原数据啊,这时候创建原数据里边它是两个什么两个零,刚创建表呢,原数据写的都是两个零。
10:29
啊,那之后我们又做了一个事情,是不是就put的呀,Put的我们刚才测了会改原数据吗?不会改,所以我们当时那个时候,现在抗新它是个什么,它是个零对吧,还是一样的,其实跟这个现象是一样的,只不过说当时那种测法呢,用比点特殊,还用的中间穿插了一个,换了一个什么比数据库,所以才出现零这种现象,对吧?正常来而言,你先in色的再库的,应该至少得是一个什么,得是个一对吧,因为ins色的这个往里边去写的时候呢,它会干什么,它会去读取,因为ins色这个命令嘛,走的是MR任务,MR是一行一行读的呀,他就能知道往里面写了什么。
11:09
多少行数据,它就能把这个原数据给它放在这,那我都原数据当中都有这个行数了,那我就干什么,我就直接用吧,对吧,我就直接用啊是这种现象,要搞清楚这个东西就好了,行,其实当前这种情况我们总结一下,大家现在总结出来的是,呃,Count的心一定不走mmr直接用原数据,原数据呢,有可能是零,有可能是其他的数字,反正现在得出来结论是不是count的心不走mmr对吧?啊,但是这个结论呢,不准确,后面还有一个点我们要再去扩展啊,所以你现在不要这样去记啊,不要这样记,因为后面的还有一种情况下,还有一种什么现象呢?呃,现在啊,我们用in色这个命令的时候,是不是它的一个number files跟NUMBER2个这个同时修改啊。
12:02
这两个参数是不是两个都会变啊,对吧,后面二凸的这个命令是不是两个都不变啊对不对,不的命令是不是两个都不变对吧?记一下啊,就音色的两个都变,不的两个都不变,后面还有一个命令只变一个只变这个只变文件数啊,就文件数增了,但是行坐没增,那这种情况下走抗心呢,它就会走马路了。因为相当于原数就变了,但是行数我不知道,因为我不知道你这个新增的文件里边有什么多少行,先跟大家说一下这个事,那后面我们聊到再聊啊,再给大家把这个现象呢,再通头再捋一遍,再去总结啊,我不是说到那个时候呢,就只说那一个现象了,大家可能把这个都能忘了,我再把这个东西再给大家测一下,把整个的总结给大家OK吧,啊就是其实这个地方看到新这个东西呢,就跟我们的原数据相关的啊,主要是这个点啊,要注意一下行。
我来说两句