00:00
好,那接下来呢,我们看一看建表语句,你看这个建表语句看一下疯了是吧,这么多选项,你看多少个中括号啊。看到没对吧?啊,全是中括号,所以呢,这个东西我们拿出来要挨个解释了,但是不是说全部在这块都给他讲完啊,我们可能还有其他东西对吧?啊,那这块呢,我们摘出来往这一放对吧?然后呢,我们把它调成这个所谓的什么circle,也没有多少关键字变颜色对吧?那无所谓了,首先table table表明这种东西是不是没有加所谓的这个什么。中二啊,对吧,啊必须要的,那其实包括下面的列名都是需要的,对吧?好,那我们一个人看一下第一个这关键字叫什么意思。
01:06
对,叫外部,就是不加,也就相当于是内部的对吧,加了就是外部的啊这个词类,也就是说在have当中,这个表呢,分为内部表和外部表。啊,至于什么区别,等会我们再聊,先了解这个事,哎,这是外部的对吧,那这个呢,会引出来,我们还有着表,会有什么内外之分。另外的分对吧?好,那这个if not exist我就不展出来了,这个比较简单,还是一样的,如果表存在你直接创建,那搞错对吧,不存在的时候你才能创建,那加了一个一分exist,就算你存在我也不报错,反正不创建了,对吧?啊,这个简单,然后接下来是这个啊,这是column name对不对,Data table,这不就是我们写的ID string,然后呢,逗号隔开点点点和并三就是列可以勇。
02:08
多个嘛,对吧,啊,列出一个多个啊,这个也比较简单,那么后面呢,这个也是一个中号叫comment,这是不是追加了什么注释对吧?解释刚才那个字段的解释,哎,你加一个啊,这个呢,跟表一样啊,那接下来呢,这还有一个。还可以加一个comment,这个是表的一个注释,哎,当年那个表是干什么用的,对吧?啊,这个可以写一下啊,这注释呢,比较简单啊,那接下来看这个地方。叫partition的分区,这后面是不是一样的,叫com类型字段类型,字段类型也是可单啊,也就是说我可以按多个字段分区,这个呢是用来创建分区表的啊,这也是我们后面要去聊的啊,叫分区表,还有这个地方呢,还有个叫拉。
03:13
叫什么东西,按什么集群是吧,从名字翻译挺奇怪的啊,其实呢,它也是一种表,它叫分铜表啊,我们后面啊,这个时候你不用去找握,因为在我们的第七章专门去讲分区表跟分表啊,专门要去讲的啊,所以说现在既然我们还没讲到的时候,这两个关键字我们也用不上,因为可选项嘛,我们不用就好了,对吧?啊,这是后面我们要专门去研究的,但是我们我们在看到这个东西的时候呢,要去了解一下这里的字段到会干什么事的,然后接下来。对说,但是你要注意啊,他后面还有一个兔。
04:03
叫bucket啊,这个呢,其实也是跟我们分筒表有关的,分筒表之后呢,我们会指定啊,这还是分读表所需要的建表语句,我们会指定按照什么字段去分图,以及分几个筒。啊,Into number buckets几个桶,桶的个数嘛,对吧?Bucket不是桶吗?桶的个数,这还是分钟表里边的东西啊,现在我们先放一放,然后接下来这个东西,看这什么,这刚才我们是不是都见到过limited限制这个行格式的限制,后面是不是写什么fields terminated by connection items terminated by,什么map case terminated by等等这些东西啊,以及什么line。Community的半行的限制,就是说这一行数据将来怎么定义对吧,就在这个地方来做的啊,在这里方如慢好,那么接下来还有一个叫动,这个是定义旁的格式的啊,然后接下来这个地方缩的as后面呢,要一个fair啊,那就是说这个不知道什么东西啊,其实给大家说一下这个fair就是大家之前学过的text。
05:36
就类似于这样东西,Text的什么拉兹罗,然后那个什么呃,Step压缩方式,文件格式,其实指定的文件格式类似这样东西,对吧?啊,你要按什么存储,就是haveb里边呢,因为你对接的是MR嘛,MR里边是不是可以用压缩呀,对吧?那还就可以用压缩,也就是说可以指定这个文件格式,那默认的是text,默认的是最普通的文本文件啊,默认的我没有指定对吧?啊,默认的最普通的文本文件后面我还讲很多的啊,然后接下来叫这个的刚才都用过了,对吧?库是不是也有对吧?这个是指定表的存储位置,位置信息对吧?啊,我们可以指定啊,如果不指定,默认就放在那个当前库是哪你就放在哪了,对吧?啊,就默认。
06:36
跟这个相关的啊,然后还有这个东西。TBL是不是跟DB是一样的东西,对吧?可以额外加一些属性啊,这是额外的属性,额外属性其实没啥用啊,其实没啥用,最后一个叫啊,大家都认为他是别名叫select statement,你看后面as后面跟着是什么?
07:06
As叫select statement select叫查询,Statement叫语句,查询语句也就是说什么意思呢?在have里边,有时候我们建表的时候,我们可以根据另外一张表查询出来,假如另外一张表有十个字段。A表,举个例子,有十个字段,现在呢,我想建一张表,这个表呢,不是十字段,可能只要五个字段,但是这五个字段都是什么?A表里边的我就可以根据什么呢?Create推广as select a,把五个字段一写from a,用这种方式解表也可以。而且这个建出来的表里边自带。通过查询的方式去干什么?建表啊,通过查询的方式去进表啊,是这种意思啊,也就是说这里边等会我们要讲的xterer这个东西是重点要讲的,因为内外五表在面试的时候经常会被问到的,对吧?分区表也是要未来要讲的,但是现在还聊不到这个事啊,这个是用的最多的,生产文件当中绝大部分呢,都是分区表啊,都是分区表,到时候我们会说为什么会用到分区表,然后还有用到的,因为你不止一个列,你列与列之间一定有分割符,你一定要指定的,对吧?其他的东西都还好,用的都比较少了,那主要就这些东西对吧?好,这是见标语句的一个解析。
我来说两句