00:00
那所谓的二级分区是个什么意思呢?是这样的,嗯,刚才我们说的我们数据呢,在往往在生长环境当中是按天来放的,假如说这个按天放的数据量呢,还是太大。我还想再分对吧,我可能想着他就可以再按什么按小时去分了,对吧?啊,我一个小时再给他一个什么目录,对吧,那这就涉及到二级分区了。二级分区,也就是说有两个分区字段。啊,那我们再来创建一张表啊,我们看一下这块有没有,呃,还没有数据啊,那我们俩叫c table叫depg向发现PR2对吧?啊然后呢,分这个里边的字段,我还是正常的去拿一下啊,这三个字段还是一样的。啊,三字段还是一样的,然后接下来呢,我们要指定它的个什么分区磁段,分区磁段注意这个地方要加什么,加ED的对吧?啊一成半,然后后面呢,跟一个字段啊,当然现在是二级分区,要跟两个字段,那首先呢,一个D用string类型天对吧,然后再来一个什么hour,然后呢,我们也用string类型啊这种所谓的二级分区,好那接下来呢,我们还是一样的,用for的这个东西拿过来走一下,哎,那这个二级分区表我们就已经创建好了,就是这张表吧,对吧?啊就是它好,那我们接下来往里边放数据,我们还是把这个数据啊,123分别放到三个不同的小时里边,假如说都是放在10月27号,我放在那个,呃,12点,13:14.ok吧啊。
01:56
然后呢,我们还是一样的,漏的这个命令都一样啊,漏data叫local pass,然后呢,跟着我们的路径对吧,叫OPT model,贝塔目录有一个dept 1.tst。
02:16
对吧,然后呢,Into table哪张表啊,Depg,然后下划线叫P2这张表啊,注意这个时候是一个分区表,所以说加载数据的时候,我们要加一个什么分区信息,对吧?啊加个分区信息这个地方呢,加一个partition括号,那这个分区信息应该怎么写,之前我们写过好像是D等于2020杠幺零杠二七对吧,现在有两个,那你就这样写呗,第二个是不是hour呀,Hour再等于一个,假如说11:1213对吧,我们就随便写一个啊行走一下加载数据了,好,那我们来访问一下这张表,看一下第一笔点二,首先呢,这是第一个,对这个分区点进来,还有个二零是一,再点。
03:08
是这样的一个情况,对吧,第1PD1在这里边是不是又多了一层目录嘛,对吧,又多了一层目录啊好,那我们还可以这样写,假如说呢,我们再导一个数据啊,导到12点,然后呢,还是放在10月27号,这个我们呢用二港网,港王是个什么东西,呃,只知道海王是吧?然后呢,我们再放一个十,这个28号的11点,假如说啊啊这样的情况,那现在呢,看啊它的表应该是什么样的结构。大的是不是有17 27 28,然后这里边是不是有两个11 12,而对28里边呢,只有一个11啊,这就是所谓的二级分区,那我们查数据的时候呢,一般的来说都要把两个去写全了啊,就是说C,假如说我们要写全秒扫描也可以啊,DB下划线叫撇二对吧,这所有数据十到60。
04:16
都有吧,因为我们三个文件,正好一个文件里面两个啊这都有,然后呢,我们也可以说,哎,我不想查所有的,我想查well,这个对我根据一级分区来做啊,也就是2020杠幺零杠27,那就前面两个对吧,同样的我还可以end our等于什么11,那就前两个对吧?啊当做普通磁带,那这样的情况下呢,都可以避免全表扫描,只要你V药当中带了分区字段的过滤条件,都可以干什么避免全表扫描。啊,都可以避免掉全面坐标是这个意思啊,这是我们所看到的啊,二级分区对吧,查询分区啊。
我来说两句