00:00
好,前面呢,是我们所讲的一些查询当中一些东西,包括这个分区表,三通表,那接下来呢,我们去看一看这个函数,现在所谓的函数呢,就是在我们写S的时候用的sum吗?Count呀,这些东西都属于函数,它自带的有茫茫多的函数啊,叫show functions,我们看一下。289个对吧?啊,那里边肯定有你所熟悉的啊,有这个max me对吧?啊,那你看这个什么mini month这个干什么用的,操作时间的,那这个取分钟,这取月份对吧?啊取月份好,那还有什么。能看到什么东西吗?你这里面有几个能认识的哪个啊对是吧啊嗯,这几个东西呢,看看对二的对上呢,减日期对地呢,日期的差值对吧,加日期减日期是不是日期跟数字操作呀,那对呢。
01:15
日期跟日期操作对吧?啊对他分化的呢,日期格式化对吧?啊,日期格式化这个能看得懂啊呃,Con是吧,虽然我们没写过,没用过,但是应该能看出来,猜出来它什么意思。拼接啊,它的拼接两个字符串啊呃,那这些是不是也用过,这里边就比较多了,对吧,你看这里是不是有这一玩意啊,对吧?啊,什么小于等于大于奇奇怪怪的东西是吧?嗯,As对还行啊,Avg啊对吧?啊,这些东西比较多对吧?好,那也就是说这里面有这么多的一个函数啊,那假如说我想看一个,现在这个函数我不认识。对吧?举个例子,假如说这个之像这个函数,可能大家都知道这个干什么转大写对吧?啊好,假如说这个函数呢,我不知道怎么用,那怎么做呢?可以DC方式啊,DC方式后面跟上这个函数名,它就告诉你了干什么事,看这返回一个S加,也告诉你怎么用,对吧?Apple里边传一个什么字符传返回值是也是一个字符传will将会将所有的字符都转换成ACA大写的,对吧?啊,就是这个意思,好,那有的人说这个东西呢,哎,看不懂对吧?还可以这样来玩,怎么说呢,叫DC方程,XD的注,以扩展的形式来展示这个干什么事呢?它还能给你一个例子,对吧?啊,这样就比较方便了,但是注意不论是所有的。
02:52
都有例子啊,不是所有的都有例子,而且这个里边呢,还给我们说了当前这个函数它是一个什么类型的。
03:00
这里面呢,就有一个UDF,那我们这样来看一个啊,还有一个嗯,在help当中呢,它的函数分为这三种,UD udud TF就是这三种udf,你看啊,那你对比这两种,你能不能对比的出来,虽然我们这个X explore,当然你不知道是吧,那刚才我们看到这个Apple,它是一个udf,这个mean,它个udf。但你能不能从这两个来总结一下,什么叫udf,什么叫udf?
04:05
类似于count me max avg。这种我们不是把它称为叫聚合函数,聚合函数什么特点对多进一。啊,类似于这个Apple。对吧,类似于Apple这种东西,它是什么一进一出,好来我们写一下啊,这边呢,有所谓的udf,我们刚才说了叫一进一出,还有一个udf对吧,它呢是属于叫多进。那你推一下UDTF多进多出,一进多出这样啊,那么接下来的问题是这个一跟这个多指的是什么东西呢?有同提到,对这个所谓的一,或者说这个什么多指的是指的是输入数据的行数,注意是行数,不是个数,也就是说之前我们是不是还用到了一个什么东西叫NVL,还记得吗?NVL这个函数是不是要传两个参数啊,但是它是属于什么呢?
05:58
它属于UDF,刚我们说UDF是一进一对吧?啊,那注意啊,所以刚才我们说的这个所谓的一跟这个多指的是什么行数,不是说这个函数接收参数的个数,就是说你原来是一行,经过我这个函数之后还是一行,但是你之前这张表是十行数据,经过我这条函数之后还是什么十行还是十行数据没有变好,那u daf多进一出还是指的行,那你看我做count新,我之前1万条数据,我做一个抗德新是不是变成一条数据了?
06:41
对吧,是不是函数会减少啊,对吧,就是多进一出嘛,哎,我给你好几行,你给我聚合成了一个结果聚合嘛,对吧,那所谓的UDTF呢。一进多出,就之前可能是十行,我给他干什么,变成了20行,30行,一行变多行,对吧,这个叫一进多出,这个体现的就在哪呢?呃,咱们所写的MR当中what count。
07:10
本来一行当中是不是有很多单词啊,最后我是不是要把这个单词给它干什么,拆开啊,放在一个单词放在一行啊,对吧,是不是函数变多了啊,这个就相当于那个spli的这种东西啊,就类似于这种一进多出的这种感觉啊,所以在这个当中呢,系统函数当中,我们要知道一下,它分为udf udf和UDTF。啊,UDTF函数对吧,那udf呢,我们就让它一个普通函数对吧,Udf叫聚合函数,而UDTF它叫什么呢?它叫炸裂函数,就会把一行数就给它炸开,变成多行啊,所以叫炸裂函数啊,叫这个名字啊,稍微关注一下啊。
我来说两句