00:00
刚才呢,我们是将什么将这个数据呢。将那两个表关联到一块对吧,两个表能感觉到它是关联的表了,因为我创建的那个have表的时候,同时也把那个,哎,这表也。创建了,那接下来呢,我们更重要的是关注于数据这一块吧,看是不是两张表都能够同时获取到数据,对不对啊,那我们先看一下当前这张表是没有内容呢,因为刚创建完的嘛,看一下嗯,我们的表是先收tables。刚才我是做了一些准备数据,因为我之前那个ERP表没有数据,对吧,刚才我把这个数据找了一下。TABLE4这张表对吧,Select from。什么?这个是正常打的一些日志是吧,然后你看这个表里边数据是这个字段能看到吧,哎,但是他没有那个实际的数据,然后我们可以扫描一下这张表,它也是没有什么的。
01:01
当前当中跟他关联的是一样的啊。没有任何一条数据,那接下来我们往里面导数据,导数据之前是不是有那个什么漏加insert这这种方式啊。对吧,啊这种方式OK,给们看一下。那他这种啊漏是加载不进去的,你要注意一下。我们通过漏漏这个命令系统漏。对吧,然后写我们那个路径,我们拿一下这个路径在CDD啊这里边我有那个DP跟de pd,我把数据放在这。然后下面Ep.t吧,然后后面呢。Into table对吧?哎,你要往哪张表导出去,我们这个表的名单比较长,拿一下。走,我们先通过这种方式发现。
02:01
导不进去,因为它是一个关联表,它不让用这种方式导,那我们只能通过什么,而我们尝试再通过音色的这种方式导了,音色的这种方式在这你自己照这个文档练习的时候,你也可以看一看啊,这种方式能不能导入insert into table,然后通过这个查询导入吧。这个就是走的是什么。MR了,要找MR吧?啊,我们通过MR是能够将数据写到。还这还这,OK来。04016这张表,然后EP这张表,我刚才把数据也导入了,等一下。这个咱们那个集群每次跑完妈任务的时候,就相对时间比较长一点肉。导入之后,我们可以在那个在这个地方扫描一下有没有数据,然后在这个这个地方来看一下有没有数据吧,Select新from这张表叫这个吧。
03:14
有数据了吧,啊有数据了,刚才这没有数据,他会什么错法查的时候,然后我们接下来看一下这辈子能看数据吧。也是有数据的这块是对应的,它因为我们在have当中一条数据就是一个是么?EP number它对应的有六个列是吧?啊,总共我们在汉当中有七个列嘛,那第一个列我们把它抽取出来成了它的一个r key对吧,那在h base当中呢,它也一样,它的一个r key啊,是这样的。啊,整个的这个是have当中看到的一条数据,对吧,这个地方是它的刚才我们对应的那个列,啊,对应的一个一个的列,这样能关联起来,能关联起来然后。那你看啊,如果是这种方式,我们通过黑色的这种能导到了吧,就是数据能导进去了,那接下来要做分析的话,你进行查询也可以吧。
04:09
也可以,那你要注意一下这块。这个地方是我们什么?Have的那个我要耗对吧,就是默认的一个目录,那这个表示我们刚才创建的表。那这个地方地方下面按理来说这个你看它有一个p.tC对吧,那这个地方呢,它底下会有什么呢。空的。那你想想看,他数据放在哪啊。在辈子吧,哎在辈子,他那个数据在这呢。H有一个data吧,在这它有一个default。他这里边儿有数据呢。它在这呢,因为你两个你have跟HP都是依赖于HDSS吧,它它有必要你两个表示做关联的,他知道了,他有必要说在have当中存一份,在HP当中又存一分吗?没有说这个必要吧,所以说他在have那个地方只是创建了一个目录。
05:11
对应的是MY搜当中那个原数据信息对吧,一个目录,然后实际的数据呢,它是放到了这放到这,而且它也是用那种什么。字节数组来存储的,所以说我们直接load的时候,你想一想,当时在讲have的时候,Load这种方式,它是不是直接把文件类似于,如果说引用的是本地,是不是copy了一份到那个文件夹底下了?是put上去的吧,如果你用的是HDFS的一个数据呢,它是什么情况?它是MV进去的对吧,剪切进去的,那想想看,我h base的一个底层存的数据带出组,你说你直接用漏这种方式,直接把一个什么TSD文件格式的文放到我S里边,他能接受吗?对吧,哎,这个地方所以说我们直接用漏,刚才是不是报错了呀,哎就是添加不了,就是原原因在这,它仅能存储的数据那个格式都不一样,那你能放数据吗?哎,所以说直接通过load是加载不了的。
06:06
啊,加载不了的,这是往那个已存在的关联表里边放数据,放数据。
我来说两句