00:00
好,接下来呢,我们看一下第六章啊,第一个指标需要我们来分析的,那这个指标呢,就是这个用户活跃主题,这里面涉及到每日活跃,每周活跃和每月活跃的主题啊,其实这指标啊,应该算是最简单的一个指标了,但是呢,把它放在这儿就让大家入门,同时让大家感受一下在书场里面如何去分析这个指标啊,那首先先提出来了,我们要分析。当日的热播,当周的热播和当月的活跃,那这么多几个指标。那产品经理一百九下就给你提这个指标吧,剩下的事他就不管了,那接下来由我们来做,那由我们来做,准确来说啊,要算这个日活很简单了。那只要这个设备在今天登录过,我们就认为它是活跃。那只要找出设备ID,它不会空。
01:00
对吧,只要有,然后进行一个驱虫对吧,然后一个抗心。结束了,是这样吗?啊就是这样的,那这里面如果在数差里面就不能这么去做啊,那首先呢,我们要在这个轻度的一个汇总去从放在DWS层去做,那这个count星也是最终出结果要放到ADS层去做啊,每一层只做每一层的事啊,那我们来先看一下啊,算每日博弈。OK,那么每日活跃呢?这是我建了一张呃,统计每日活跃的明细表,并不是最终的这个结果啊,并不是算出今天每日的活跃,我先算出每日活跃有多少个设备啊,算出多少设备之后我再进行抗性啊,相当于先是进行了一部驱虫。
02:02
啊,技能操作,那大家说要是算每日活跃,本质来说,我只需要有这么一个字段就OK,这来定,那其他的像什么版本号啊,这统渠道啊,手机型号跟他一点关系都没有。可以这么认为吧,啊,那为什么还把它放在这了呢?就是因为产品经理最擅长的就是电需求改,那比如说啊,现在呢,我们是算完这个日活了,突然间他来了一个要求,你按照渠道号。去统计日报。比如说你从小米这个渠道有多少人活,从华为这个渠道有多少人活,那你怎么办?这个字段需要加上啊,加上这两个字段,这两个进行多弱板,然后再放新统计。那他又变了,他要统计哪一个手机品牌。他的热播,比如说华为手机有多少日播啊,苹果手机有多少日播,那你又要讲这个这个。
03:04
那同时他又变了,他又增加说哪一个屏幕尺寸的,它的日活是多少,那你又要统计,因为站在产品经理的角度来说,其实这些关联性的一个查询对他是非常有用的。啊,比如说通过不同的渠道去统计它有多少活跃,那这个渠道用户有多少,来多多还是少,那就对他日后的一个运营起到了一个决定作用啊,我是重点投一些钱还是怎么样,还是搞一些活动,那同时这个不同的手机品牌,那也是你是华为手机的,还是说这个魅族的啊,还是说其他的,那它也有定点的运销营销行为,还有这个屏幕宽高也一样啊,不同的尺寸我可以推出不同的这个活动啊,或者不同的一些细节等等。啊好,那这里面呢,其实我们先只出这个日活,那我就把其他能想到的都放在这儿啊,防止这个产品里再增加需求或者变化需求啊,那我就放在这OK,那么这个日活它根据的表,或者怎么去根据哪里去取这个数据呢?是不是ID呢。
04:17
启动日志为什么选中了启动日志,不选择七大那11种日志呢?因为咱们这个日活只是记录它,只要启动过是就算活跃了,那其他的是事件有可能还涉及到点击啊,啊涉及到这个评论收藏啊,不一定有啊,不一定全,那这个是最全的啊,只要他一点开,立刻就产生一条启动日志啊,是非常准的,那就用这个啊用它啊,但是我们用的是启动日志。那下面呢,就要向这个日活明细表里面去添加数据,也是导入数据,那导入数据呢,就基于的是DWD层的启动日志表啊,那DWD层启动日志表里面包括设备ID啊,UID等等一系列信息它都有。
05:15
那只不过呢,现在哎,我要对这个设备ID进行驱虫过滤隔数板对吧?啊,因它去隔楼板驱重了去完重,你要是用它去驱虫,那中间这一块如果你直接写什么uz ID版本号,它就会报语法错误啊,因为这里面剩下的就只允许写句格啊,错了。啊,这函数啊,那这个函数呢,这里面我们就要想办法把这些啊,比如说多个用ID,我给它拼接在一起,用竖线。拼接啊,分开,那日后我要在取这个数据的时候,比如说产品经理又来了新的需求,说按照渠道去统计,那我只需要用竖线把它再打开,炸裂开是不是就OK了啊,就直接能用了,那我这张表还需要再重建吗?就不需要重建了,在企业当中还有一件比较难搞的事情,就是申请建表。
06:20
啊,建表是要有权限的,是要经过这个会议讨论的,并不是说你想建想建。那比如说你像我就为了统计这一个指标,我建一张表,那下一下一次产品经理增加了这个渠道号,然后你这两个又建一张表,然后产品经理就加一个手机品牌,你又建一张表。那这里面你会有上千张表,那维护起来非常是恐惧型的啊,啊肯定是被吹的,那怎么办呢?通常情况下它会建,诶我把你说的先能考虑到,如果在建的话,还是往这里面去插啊,插入数据一统计就OK了啊,那这个要注意哈,建表非常非常麻烦,甚至你要各种审批,这个周期有可能是一周以上,这就说为什么这个干活在其中效率比较低。
07:07
啊,因为他要考虑的事比较多,比较全面,不是像咱们说的,哎,那我就算一个指标,我建一个就完了呗,啊五分钟的事,那不是他要从那个系统一些细节啊,全局去考虑,到底要不要建电表啊,建定表的一个作用是什么啊,日后是否方便管理啊等等都控制完了,然后还要审向领导去审批这个权限啊领导呢,最近的事又比较忙啊,你这个审批迟迟都没给你批过,那可能一周时间就。我去。啊,所以说能提前一次性建好呢,那后面就啊,不要争取不要再经常去经常改动它啊啊。那下边啊,我们就向这张表里面去插入数据啊。那左侧呢,这是建表语句了。
08:03
好,那像这张表里面插数据,我们来写一下。怎么写呢?银色的。对啊,那像这张表里面DWSUVD点插入数据,那像它里面插它是一个。分区表,那你这块就得指定分区RG问,而这个它这个分区的名称叫DD,那你这块呢,就是DG,那插入到哪个分区,209杠零二杠102月12好,然后往里面去插入出去sli好,那这里面第一个知道他。啊,我是肯定要有的,那剩下的阶段一会儿再说。From from哪张表呢?DWD层的start是start吧啊startup啊,你说启动日志表啊,DL程的啊,然后啊按什么V尔条件外尔DT等于今天是多少号了,2019杠零二杠102月十号是菌,然后按照这个设备ID进行分组去重对吧,着重法BY好。
09:31
那这样这个架构就写完了,那剩下的事儿呢,就是要把这些内容。聚合信息啊放在这儿,那聚合的话,之前我们学过有什么呢。啊行转列列转行当中用的是WS对吧?C然后WS啊然后呢拼接啊左上呢,我们用一个竖线把它们隔开啊竖线,然后后面用一个Co。
10:09
Set啊set,那这里面set的内容是u mid s啊对吧,然后后面把它放为UID是这样吗?啊这样那剩下的后面这些是不是都是一样的啊一样的啊复制粘贴啊拿过来啊。啊,直接拿来。那这样啊,就写完了啊,我稍微回顾一下,我要向这张表里面去插入数据,那这张表的数据呢,来源于DWD层的启动表啊启动表那其实我们最主要的就是向这个设备ID里面去赋值,同时赋值的过程当中要进行驱重,比如说不啊,一定要好,那首先把它写上啊,然后把这个整体这个框架啊写上之后,中间这个过程就是用这个CLAWS将它们所有的内容拼接在一起啊,聚合上就OK了,那么来看一下啊,主侧呢,这边是创建表。
11:29
创建表之后,然后向那张表里面插入数据。相当于是日的日活的一个明细表的一个处理啊,并没有对它进行一个看得清,比如说求出具体的日活是多少啊,那剩下要求日活的话,只是对刚才这张表进行一个count就结束了。因为已经对他进行驱除了。
12:08
好,那先把上查一查select。行。嗯。啊。U6啊,那你看就相当于这里面。其他的多余的这些东西都用竖线给他。拼接在一起了,那日后要取这些值的话,只需要炸裂开是不是就OK了,哎,之前咱们是不是也做过啊,把某一个某一列啊炸开哈,好,那这个呢,就是这个日国的明细,那日国的明细完之后,下面呢,我们来算一下周国的明细。啊,周鹏的面积。
我来说两句