00:00
好,那我们看下这个需求啊,他说统计每个类别中的视频热度TOP10。啊,每个类别,然后呢,这个地方有一个举个例子,以music为例,也就说他给你先明死了,就是说我就要求音乐,那这个是不是很简单对吧?就过滤出来类别等于音乐,然后用out立面就好了,因为我先例死了,就是之前大家在我们之前刚学那个认的时候,说求各个学科的前三名,有同学就提到这种方案吧,我说把有同学提到了,把语文数学英语我分开求对吧,然后unit,哎,我等于语文等于英语,等于数学去out limit对吧,De limit求前三名,然后呢,厘米三,然后利用列到一起是不是也可以对吧?那这个其实采用的就是类似于那种环对吧,不用求分组套根,但是我们要讲的不是这个点,而是要讲的上长是这样的。
01:03
我们有没有发现到现在我们现在所求的需求当中,好像到现在为止没有一个需求跟这个所谓的类别没有关系,而一旦跟类别有关系了,是不是我们在此产品里边必有一步炸开类别类别对吧?啊,要把这个类别给它炸开啊,不管是先炸开,还是最后说通过关联ID取到视频,然后就炸开类别,是不是都要去炸开这个所谓的类别啊,对吧,那这个就怎么样,很不好啊,那类似于这种情况呢,我们只要干按照类别去统计一个什么热度啊,乱七八糟这些事情我们都要展开,那生产环境当中这种呢,就叫做。复用这张炸开的表,你发现了在很多色克的紫查学里边都能见得到,那我们针对于公司当中,针对于这种情况啊,我们就专门加一张表,加一张中间表,就放炸开后的数据,如果你要取炸开数据,你从这张中间表当中去取。
02:11
对吧,那以后只要关于有类别的需求的时候,我们从这张表取,是不是有很多需求可以复用这张表啊,我也就相当于所谓的此查询,是不是执行了一次就执行了一次,以后就不需要执行了吧?是不是这样的情况啊,提高效率用的啊,所以呢,这个需求倒不是本身有多难,这个需求已经拿了music为例的,等于一个music炸开之后,然后类别等于music,然后去求一下这个呃,视频观看数对吧?啊,排个名就好,这个需求很简单,但更重要的是在于我们要重新建一张表,那这个建表语句应该怎么写?啊,把最早的这个建表语句拿过来干什么,改一改,那这个呢,我们取个边名叫开啊,然后这个字段还能用它吗?我就直接用什么了,是不是用就行了,其他字段是不是保持不变。
03:12
对吧,我只是把类别炸开啊,只是把类别炸开OK吧,其他字段保持不变好,那么接下来呢,我们把这个数据这个表呢,我们去建一下啊,就是其他orc啊啊啊,这个我们都不用管,对吧?然后呢,去创建一张新的表,然后接下来呢,我们往这张表里面去导入数据色的into或者overright都可以吧,那接下来我们怎么往里面去导数据啊,这个是要炸裂出来的字段,同时还跟原表字段要做关联,所以我们一定要用什么测写表了,对不对啊啊,要是测写表好,那接下来呢,写那的好字段,字段呢,是不是这些个字段呀,但是呢,没有类型对吧?啊,那我们把这个拿一下,我把类型给他干什么去掉,因为查询里边你不能带类型了吧。
04:12
这个名字我们换一下,我们还是叫内炸裂出来叫name好,他from哪张表原表对吧,叫啊来explore的所谓的这个叫EG这个列对吧,呃,Egeg对吧,我们用一要这张表,然后接下来用的时候,包括下面都很简单了啊,都会说很多对吧,然后呢把。就是说这个需求呢,就是说讲这个内容啊,其实这个只是相当于我们数仓当中的一个缩引啊,就书仓当中,我们到时候会讲很多的分层,一层一层的,其实就是为了提高单个表的一个复用啊,复用性,这个就是所谓的卡住了是吗?不至于啊,不应该啊,如果卡住了我们还还真得用紫这个东西过不去,应该是看日志是没有问题的啊,我没有按回收,哎,我说那还卡住了不对,他这个正好到最后他他这个光标刚才。
05:56
跑到前面了,大家看见没,我以为我还回掉了,我说呢,我说不不应该啊,我们我们拿这个当查询都能做是吧,现在拿这个是普通的做一个查询都做不了了,原来是没有碰到回车啊,发生了乌龙事件,因为刚好这个到这个最后面,刚才我的光标是不是在前面啊,我就以为我按了回车,这个乌龙事件真卡住了,没有再跑再跑。
06:46
好,这个数据就导进去了啊,导进去了我们可以那的新啊,或者说这样吧,我们那的VIVO ID啊,我ID是大写,这个ID是大写是吧。
07:00
然后呢,我们看这个category,我们还是列名还是用的category,但是它已经是一个自传了对吧?呃,然后呢,From这张表新表对吧?看这表,然后呢,LIMIT10我们看啊A是哪个字段写错了吗?哦,Video我起不写成video。应该是微ID啊,那此时我们看一下啊,哎,就这个吧,这个正好还有对吧,是不是有已经炸开的效果了,本来这俩这个数据肯定是什么一行吧,啊肯定是一行,现在呢是两行,而且这个数据我们再找到它中间肯定用这个and符分割的对吧?And分割的好,那第一步呢,我们就说把这个拿出来了,拿出来好以后接下来做这个需求说统计每个类别当中视频的热度,以music为例。视频热度是不是还是按观看数,这个所谓的视频热度你可以按观看数,点赞数,评论数,这个是不是都可以对吧?视频热度是可以这样的,但类别热度你不能这样做,对吧?好,那接下来我们这个写一下啊呃,他要求所谓的这个视频。
08:14
热度这个好做吗?太简单了,对吧?啊,就谁那个的先查什么东西不知道,但是呢,我已经知道从哪张表当中去拿数据了,从这张新表当中去拿数据了吧,对吧?啊,From这张表啊,然后呢,Will是不是加一个条件啊,他说了以music为例啊,所以呢,我们这个category。这是不是炸出来了之后的string类型了,对吧?啊看等于什么music啊等于music,然后呢,不光要这个,它要按照视频热度,那我们视频热度还是all by views对吧,还是看观看数,然后呢,这边应该是de IC厘米十,那我们要查的东西呢。
09:05
他当前那个视频对吧,那VIVO ID我们注要一下,接下来呢,把vis带上吧,对吧,我们也看一下它到底是多少啊第一名音乐第一名最多是多少,大家可以去听一下这个音乐对吧?因为你打开那个油管之后,你把这个ID粘进去就就能看到视频了。但是我这确实是亲自在翻领网络的,不好使啊,呃,观看入第一的这个视频啊,这播放的还挺多的,这17年18年的时候啊,你现在去看可能数据比这个还多了,对吧?这音乐肯定很老了,这个音乐肯定很老啊,这里边的音乐啊,行,这都是音乐的吧,好,这是我们所说的第所谓的第第几个需求,第五个需求了,对吧?啊第五个需求查询,其实呢,更重要的不是说呃这个S如何去写,而是说以后遇到类似的很多的需求,发现它有共同的一个查查询的时候,那我们怎么办?我们就把这个子查询抽出来建一张中间表对吧,那用中间表呢,提供我们一个复用,类似于做这样的事情,对吧。
我来说两句