00:00
呃,那接下来呢,我们就聊第一个关键字就是X,这个关键字叫外部的对吧,那也就是说咱们这个表呢,就分为内部表和外部表,那内部表呢,又称为叫管理表。啊,又称为管理表,我们之前建的表是不是都没有加X层的关键字对吧?好,那我们看一下,也就是说我们之前建的表都是什么内部表对吧?因为从内部表这个名字的来源啊,就是根据这个S的一个关键字来的。对吧,X叫外部表,那我没有X,我不是X,那就是什么内部表,而真正的它这个叫法呢,应该跟这个一样,叫什么管理表,那管理表这个名字又是怎么来的呢?来看这啊看我们买circle,呃,在我们的P表S这。叫manager的table管理表对吧?啊,管理表的名字是这样的啊,我们之前建的T t1是不是没有加X3的关键字啊,对吧,那这个时候我见表的时候,我能不能加一个呢?可table,哎,应该加一个什么X是吧,你拿一下这个呃,Table,然后呢,叫这个test,诶刚才有哪几张表TEST1,那我再来一个什么二,对吧,好还是叫ID string创建一张外部表,我看一下A2。
01:41
二是啊,对,这这个地方都有啊,那这个地方我只是没有什么没有刷新是吧?啊所以说看到的那这块有啊,确实我刚才瘦台我在这看到的对吧?啊还创建二应该是什么创建四了是吧?啊创建四了啊,它就是一个什么外部表对吧?啊创建一个外部表,那我们来刷新看一下啊这块啊刚才没有刷新,所以没看到对吧?四你看这个表的属性叫ex table对吧?所以呢,有两种啊,一个是管理表,一个呢是外部表。
02:13
啊,一个外部表好,那我们更重要的不是说表的类型对吧,更重要的是看它们之间有什么区别啊,有什么区别对吧?好,那我们来看一下啊,所谓的这个管理表,也就我们内部表呢,它当我们在删除这个表的时候呢。删除表,那首先原数据肯定会被删除对吧?啊,原数据肯定删除,那同时这个表里面的数据,也就是说HDFS,如果你是一张管理表都会被删除。就两个同时删,而如果咱们是这个外部表,如果是这个外表对吧,那么在删除数据的时候,它只有原数据信息会被删除,而真正的在HDF上那个数据会被删除,它的区别在这啊,区别在这啊,那我们来演示一下,呃,直播过中呢,我们就要提前讲个命令就drop了。
03:28
删除一张表对吧?啊跟马一样的,所以提前讲也无所谓啊行,那现在呢,Select c from这个test这张表,这张表有数据吗?有的对吧,之前有的,而且test是一张内部表管理表对吧,好状。删掉了,删掉好以后,首先我们受推波斯还有吗?没了,那肯定这是不是test没了对吧?啊,这就没了,因为原数据信息删除了,那更重要的在这,而这user have house。
04:13
有吗?没了,目录都没了,那文件肯定是怎么样没了对吧?啊,目录都没了肯定就没了。是这样东西,好,那接下来呢,我们做一个事情啊四对吧,我往这里边去放一个数据不的嗯,test.tsd对吧,然后哎,不是test.t应该是ID是吧?id.TSD我给它扔到刚才我们所占的路径里面啊。好,那这个时候谁select from这个TEST4。是不是能查到数据,这个没问题,Put进去的嘛,对吧,也就是说。数据存在对吧?好,那这是一张四,是不是一张外部表没问题吧?好,Drop table test4也成功了是吧?那么接下来呢,受table波斯的时候,大家觉得还能看得到吗?
05:14
那如果能看到你的job,凭什么叫执行成功呢?肯定没了对吧,那这个看不到,实际上就这是不是没了对吧?那刚才我们所聊的内外部表有什么区别。原数据没了,我们也看到了,对吧,确实没了啊,但是实际的数据HDFS那个东西应该在还在来看啊,刷新是在啊,对吧?啊,如果说不在了,我刷新是不是会报错呀,对吧?啊,它确实还在的,或者说我们一会点进来也一样的啊use have one house test4是不是在啊,id.C也在吧?啊也在那基于这种情况,那大家想啊,那什么时候用内部表,什么时候用web表呢?
06:01
就生长环境当中的时候。我们什么时候用内部表,什么时候用外部表呢?嗯,能不能大概的去说一说它的一个应用场景啊。就是如果这个数据不光你haveb里边需要用,还有其他的业务线也要用的时候,那这种情况下我们最好建外部表,就在你汉里面不用了,你把表删掉,你不会影响到人家的什么数据,对不对啊,如果说你对这个数据建的内部表。其他人也正常在用,你也用,你说你现在不想用了,我把表删了,浪费嘛,在这搁着对吧,原数据啊占用空间,我把财场他数据怎么样没了对吧?啊,所以说类似于这种共享的数据,那一定见的是什么外部表啊,其实内部表应用场景相对说比较少,只有这种,呃,中间表,临时表这种东西呢,我们会用内部表,其他的表我们都会用外部表,因为明显的感觉外部表能更安全一些,是不是对吧,就防止误操作啊,我就算误操作把表删了,数据还在,数据还在就有一个什么好处呢,看啊。
07:22
我看测四数没了,我可的table,我把开测四那个尖标语句干什么找回来是吧,ID select的from啊是是不是还能找到,对吧?我们说了数据在吗?你在去建表,原建表之后原数据是不是有了呀,对吧,但是我们没有刚才那种X的对吧啊,没有X的manager,那这个时候是不是数据这张表就能恢复了呀,对吧?这个安全性上角度来考虑是不是更高一些啊,就防止你把数据删了,那这个时候我把这个什么所谓的test也按照刚才的界表语序创回来,那你去查询test。
08:06
这有东西吗?没东西,因为刚才由于你是内部表删数,删表的时候是不是ADFS就删掉没有数据了,对吧?啊,所以说这是内外物表的区别,以及它这个应用场景啊,你要知道一下,其实就一个关键色X的区别,对吧。
我来说两句