00:00
好,那其实像生产环境当中啊,当前这种需求啊会少一点,因为如果说你像两个表同时建立,因为你要分析数据对吧,你要分析数据,那很少说非得进一个关联表。分且进关,那生长环境当中都出现什么样的现象呢?数据先有很长时间了,因为这个数据量也不是很大,一直用ID存着对吧,存完之后呢,突然有一天公司老板说我想通过这个数据来分析一下。对吧,也就是说H这个表先有,然后要做分析。MR是不是这种结果,那六是不是说H这个表已经有了,数据有了,我现在想要分析,是不是用MR来分析啊,现在汉也可以做这个事,就是说h base里边数据已经存在了,我现在想建立一个help的关联表。来干什么?关联它,然后帮他做分析啊,帮他做分析,现在我们是不是在h base里边已经有一张表叫h base table。
01:03
没问题吧,来看一下,就是说如果说这个表已经存在了,来建关联表啊,它其实比较简单,就是它它呢额外的多了一个。叫外部表啊,必须减外部表,OK,那你看一下其他的有变吗?只不过说改了一个名字对吧,这后面这个东西有变吗。没变化啊,一个都没变,但是我们最好检查一下里边的大小写问题吧,感觉这个好像又又又是好的对吧,对吧,啊又是好的,那这样啊,我们把它干什么干掉,给大家看一下,大家印象能深刻一点,放在这对吧,我先干什么。看C刚这个填表方式是不是跟刚才差不多,只不过说have里面表明不一样,我我总不能用这个名字吧,对吧?好来走一下刚才have是不是好的,能够建立成功吗?报错了,看报什么错?说。
02:02
你这个这个表示h base里面表达说已经存在了,在h base里边说应该用什么可的X这种方式吧,啊也就是说如果这张表已经存在了,你想在汉来做关联表可以,但是要用什么。外部表哎,CTRLX给它再拿进来对吧,其他的介要语句这些东西都一样,CTRLC啊给它进来。创建成功了,那我们直接是干什么,查询一下。是不是也能查到了,对吧,而且我们测了一个点,就是说从这个关联表是不是从have里面导数据H能查到。这个我们不用测了吧,之前测过了,那接下来是不是大家想到我们干什么。我从里边做了一条数据。看have能不能拿到的,对吧,既然你是关联表,那我们想的应该能拿到,因为我们重要的不是做这个事吗?那你看第二种情况是不是X表存在了,然后你去建立关联表。
03:06
那既然已经存在了,是不是?从很早的时候就开始一直往里面附责数据啊,对吧,那我接入关联表之后,这个东西理论上说可以再获得数据啊,对吧,那我们看一下。不的,这个表明我得拿一下吧。啊,你看那里边儿是一行形式的显示的,它每一列你看这个。这个人。这么多吧,这个是在have里边,是不是显示成一行啊,所以它显示的特别多对吧?啊特别多啊,这个东西放在这,然后接下来rookie是不是这个员工编号,员工编号来一个1001可以吧啊这样吧,为了好看一点,我把它变成7935,因为就最后一行对吧?啊,可以很快的定位到这个数据啊,7537935。然后我随便来个列吧,叫这个吧。
04:02
Manager。Manager给他来一个张三啊,张三终于升级了,是不是一直用它,然后终于变成了manager不得进去,那我们在这个地方去扫描一下。这个肯定能看到了,因为你在汉在比较远,那重要的我们关心是不是这啊对吧,关联表心from。尽量吧。两张表都是关联表嘛,对吧,都是啊走。因为里边是允许空值的,汉里边没有值,他自己给他干什么。加一个值能理解这个事,所以呢,你只做到了一个列,相当于。你其他这个链你都没有管吗。哎,我们添加的是有一个叫什么招三呢。
05:06
这里边有一个有了对吧,进来了。张三呢?张三是第几的呀?应该在哪啊,三是个数字匹配,嗯,关键是员工对应该是写的一个员工号是吧?啊员工号那张三你看这个人就是费劲提升不了。呃,那这样有什么东西对吧,是不是有个员工名字对吧,可以吧,啊,员工名字叫这个内容我们看一下啊,这个地方我就不看了,对吧,在这。
06:04
这可以吧啊,刚才应该是数据不匹位变成的对吧?啊manager这个地方呢,应该写的是圆编号对吧?啊圆工编号,那这个也能查到了啊,两边能查到才是正常的嘛,对吧?啊,你这have插入,把这被查到,把这被插入have是不是也可以查到啊,最后刚才那个now是因为啊,一个是in的类型,一个是S类型,这个不匹配对吧?啊,两个数据不匹配好,那这个联网就搞定了啊生产环境当中呢,你还可以建立关联表之后是不是还可以往h base里面再继续插入数据了,对吧?不断的插入数据之后呢,用汉去做数据分析啊,也比较方便啊,这个这做的一个关联表。
我来说两句