温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
那接下来呢,是刚才那个需求所谓的一个升级版啊,现在呢,要求的是每个视频类别啊,类别下视频观看数的一个前十,就刚才是不是多了一个过滤条件,现在没有了,假如说现在呢,我总共有。五种类别就是这个需求出来的是不是50条数据啊,对吧,那为了说就看的效果更明显一点,我改成投三可以吧,就是因为我们其实这个里边类别比较多啊,如果十的话,假如20个你就看到200条数据不好看了,对吧,我们就改一下,改成TOP3,其实TOP3跟TOP10,也就是无非最后那个rank小于等于三跟小于等于十的区别。对吧啊,它不会给整个的分带来什么区别啊,这个明显的是一个分组套盘的问题了,就每一个类别下我都要观看数前三名。对吧,它不像刚才没是不是提前可以过滤,我们可以用out,然后加limit米,现在能用out加limit米呢?不行,因为out是不是做全局排序,我们要组内排序,是不是想到了用哪个函数over开窗吧?啊用窗口函数加RA好呃,那首先呢,C来什么东西我们也不清楚啊,第一步啊,第一步先求出各个类别的一个排行,然后取前三对吧?好,第一步求出每个视频观看数的排名啊,就是先只给一个所谓的rank对吧?好,那这个怎么给啊,谁like呃,他最后还要观看数的一个排名,那每个类别categ我们是不要。
01:39
第二个是不观看书啊啊,然后我们这样啊,这样看开,然后呢,Video ID啊,我们都多放1.videoid,然后呢。观看数对吧?那接下来我们是不是要求它的一个排名啊,排名的话,那这里边呢,其实对于这个数据量来说,1000多万的数量来说,两个有重复的概率也比较低,而且求三相比我们就无所谓重不重复了,对吧,那就rank啊,呃,Over over里边应该怎么写,应该是partition by,是不是在视频品类范围内去排序啊,然后这个地方是all by,哪个views吧,De IC是不是倒叙啊,对吧?这个值呢,我们取名叫RK。
02:29
啊,加完K放哪张表是不那张新表啊,炸裂之后的表吧啊,要不然是不是这又放了一张对吧,又写自查形啊就比较麻烦了,好,那接下来呢,这个东西我们求好了,这个是一个第一表,第二就是取出前三名呗,对吧,分组他班啊取出前三名谁那个的啊其实我们要的就这个字段对吧,最后逗号给他干掉,From所谓的这个叫什么第一表,然后不要这个RK小于等于三,那我们改成三,其实为了最后结果能看的好一点啊,你十的话,其实就把这个改成十就好了,对吧?啊没有什么大区别,好,那我们把这个最终搜狗也把这个拿过来往那一放好T括号,诶装完。
03:29
把这个T拿到这,然后呢,我去缩进一下啊,把这个运行一下。啊,这是我们要求你看如果说十个的话,这个数据量都太大了,对吧?啊数据量太大啊,这个里面呢,有这么多,因为有21个品类,总共对每个三个嘛,21个品类,那你就刚才要来有210条数据啊,比较多了,OK,这是我们的这个需求。
我来说两句