00:00
好,那刚才呢,我们把这个DWS城啊,每日每周每月具体的明细做完了,那下边呢,我们就来到了这个ADS城,那最终就是要出具体的结果了,就是要求我们算出每日的活跃到底是多少,要一个数,每周的活跃是多少啊,就几道数,那就最简单了,只需要对原来的表进行一个看看它行是不就完事了啊,就这么一个简单事,那我们来看一下。嗯。那好,那最终我们要出的报表里面包含这么几个阶段,第一个,比如说这个报表的统计日期是哪一天,比如说我们经常统计的是2月10号这一天,那它的日活是多少?那下面是2月10号这一周它的热活啊,它这个周活是多少?那么2月10号这对应的这个月,它对应的月活是多少?那么月活只能算从2月1号算到2月10号,对吧?和2月10号这么一个情况好,那么下边呢,又为了可视化或者说未来的展示,又增加了两个字段,分别是表示这个统计日期,当当前这个统计日期它是否是周末。
01:24
他为啥要判断这个指标周啊,因为我们一般情况下算这个周末的时候,周五是不是都得到周末啊好一些,所以说大家判断如果这个是周末的话,那看这个指标会更准一些,OK,判完全准确,那下面呢,如果这个是判断的是月末,那是为了统计是月活的指标啊,月末指标OK,那好。到下面我们就往这里面去导数据,那其实你单独去串这个日活周活月活,只需要对DW层的数据进行抗糖星就结束了,那至于往这么张表里面,那就涉及到了三张表的。
02:11
张啊下张。那么来看一下。首先我要向这张表里面插入数据,那这张表是不是分区表?不是对吧,不是问题表,那这块就没有part啊,记住没part好,那下边的是具体往里插入数据,那插入数据一个一个是算对统计日期,那我们这里面就是2月10号,那接下来当日日活当周的当月的,那我就先放三个字段放在这。啊,上值段分别用三张表来取出对应的值,放在这里面就OK了,那在下面呢,是判断是否是周末,那这里面用到一个if的一个判断啊if判断if里面呢,有三个值,用这个逗号分开的。
03:04
那前面这个呢,是判断语句。第二个是表示成功,Yes,第三个表示失败,比如前面这个语句,如果成功输出第二个值,输出失败第三个值,那前面他判断的是什么呢?判断的是是否是周,也就是说当前这个日期如果等于前一个这个周末,也就说二你看他拿这个2月10号去判断2月10号的下一个周的周一减一是不是就是周日的日期啊,如果周日的日期恰好就是2月10号,那是就相等了,那它就是这地方就会输出Y表示。主,那其实这个2月10号他就是。周日啊,那这未来就能输出这个页数啊好,那下一个呢,是判断它是否是月光,那同样当前是2月10号。
04:01
如果2月10号他的这个月的最后一天是2月10号,那他就是月末了,但是咱们都知道2月10号它不是月末,那么这块输出的就是啊是到啊是这么一个含义啊好,那前面字段处理完之后,下面呢,就是多表的关联,那这里面首先为了处理这个当日的活跃,那select看。拉就是热活的表啊,热活的表,然后呢,这里面有两个字段,一个呢是统计日期,一个是看星抗星就取出来的是当日的日活,2月10号的日活。啊,那为什么有个它呢,是日后为了用来关联啊,关联条件啊,这两个指导完事之后,那就是日活的表示出来了,那求出来这个值它就能放到这了。那好,那下一个下一张表呢,是中国,那你说这一块from的就是中国的表。
05:06
那同样他查询的字段也是统计日期和这一周活跃的数。那它的条件是分区表必须得是周一到周。啊,周一到周日,比如说2月10号,他的周一到周日啊,这一周范围内,它的周合好,因为是2月10号的统计日期嘛。那再来,那中间呢是关联,用这个DT去关联了,那下一张表呢,就是月活的表,那月活这块from就是月活的表。那同样还要取出统计日期和月活的次数,那这个判断条件就是这个分区,因为MN是分区,它得等于22,你是落在于20份。啊,这是日期的一个判的,然后这个关联条件还是DT。啊,其实没有任何的这个逻辑在里面,就是三张表啊,纯的一个关联就结束了啊,那好,那我们来写一下。
06:12
好,来选一下。那像这张表里面插入数据。事了,那。覆盖。音动对吧,像这张表里面插出去。啊,In射的度度是不户盖对吧?啊插出来之后slide好,那第一个呢,就是那个统计日期,那统计日期呢,我们可以写死2019杠零二杠102月十号,OK,那下一个呢,是当日活跃,当周活跃,当月活跃,那这三个表呢,取决于下边三张表的一个过点,我们先不写它,先写下边也是它是否是周末,那这里面用了一个判断if。
07:11
一会里面有三个值啊,我先写最后一个,如果前面那个值为真返回意思啊,好,如果前面这值返回假返回动,那前面呢,就是判断它是否是周末,那周末怎么算呢?涉及到日期的加减,对哎。好,那是周。一对吧,啊周一哎,不对,周一是周日对吧,周日的话就是减一啊,下周一减一,那减一的话呢,这块就是下周1NEXT day,那下周一那这块就是Monday Monday。分啊,那前面呢,就是当前日期2019杠零二杠幺零。啊,那这块它得等于当前列日期,那它就是总末,那就是2019杠零二杠幺零啊这样是这么一个过程,好,那下一个下一个呢,就是它是否是闭合那一方,同样还是三个值。
08:20
啊,如果成功返回yes。如果失败返回那。那前面判断它是否是月末有一个last,对好来对那传进去日期,那日期是2019杠零二杠。幺零,也就这个月的月末,如果正好等于当前这个统计日期2019杠零二杠幺零。那他就是愿望啊,很遗憾他不是对吧,啊不是好,那再往下。
09:01
啊from from from的话,这地方用了这个多表关联啊造。那第一张表,那这个呢,可以是对抗对抗热,比如说热活的表好slide。From热和,那热何是DW UV detl detail,对啊,发这样的好,那这张表条件where。DT得等于影论分区是当天2019杠零二杠1020号,那前面查询两个字段,第一个统计日期2019杠零二杠幺零啊BT。那再来求出这边的count。那就是CT。
10:03
那这样是不是就求出来了,然后那这个CD其实就是date count。第二。CD对吧,那热活就求出来了。那要求出来之后,那下面它得。找一个啊,找一个。对张谁呢?下一张表,那下一张表示wait看啊招博啊,那张博仍然是。From中国的表DWS贝啊周,那周里面条件Y条件那周的分析表是V。啊,那这个week它得等于。周一拼上。周日啊,那就是康泰的CNC啊。
11:00
周一中间是下划线,好,那周一的日期,周一的日期这个是不是,这是周日吧。是吧,这周日吧,哎,我后面是周日,我先给忘了,前面是减七。数据变成。周一了啊,周一好,周一下午先填上,然后中间这块。一个是统计日期,另一个是对这个周国靠心啊,求出周勃的人数啊,那就完事了,好,那这块啊条件。他。第二滴D。等于那个。count.dt好,那这样呢,他们就拼在一起了,然后还要进行这啊摘谁呢?
12:00
下一张表啊,月活的表,那月活是mn count count,好,那mn count仍然是。From dws变成M。啊,这样,然后外条件。那外面条件哎,这个月它的分区是MN,那它的分区等于这个啊慢。那是2019杠零二杠幺零好。继续。喂喂,杠MM。对,这不能加分号,好,那中间这块仍然是CD和count。嗯,然后那后面加一个on条件,加条件啊,On的话make看点DD。
13:00
等于MN.dd。同时上边这块别忘了,还差两个子弹呢,把它拿回来。点CT,在N号点CT。等会啊,那这样就写完了啊,其实玩的就是那个时间嘛,对不对啊时间,然后下面呢,这是日活,这是周活,这是月活啊,那说这活跃其实就是对他们进行抗性啊,本质就是抗性。啊,所以说没啥难度啊,那我们来看一下。2C。创建完成,然后执行一下。现在发现老师写完一遍,诶打错了。二十二十是吧,啊来查一下二十二十这吧。
14:08
打的打。啊,不是WKDT吧。是这样的对吧?啊,它的这个分区是WKDT啊,我们再来一下不是WDT吗?是的。这个分区的起名字没起一致,最好起成WK或者都是DT就好了是吧?下面是BT。所以命名规范还是很重要的,你发现如果你这个起名字一致的话,其实你一看这个名字,你就知道它是什么含义,对吧?好,那这个呢,我们算完了,算完之后呢,查一下这个结果。
15:05
走。那这样呢,就你看2月10号这个是每日活跃753,每周活跃753。那同学该说了,那我这个我还有2月11号数据呢,怎么没有加进去,因为2月10号本身就是周日对吧,那2月11号的数据是不是下一周了啊,根本就没统计去啊好,然后呢,这个呢是每月活跃吧,每月活跃的时候是不是就包括了2月10号和2月11号,那是不是就比他们多了9月1号好,那你看2月10号本身是周末啊,他不是月末啊,这样呢,在可视化展示的时候啊,就非常清晰了啊这个呢就是这个活跃设备啊,那下面还需要对它做一个脚本啊脚本啊那脚本简单吧,五步对吧?啊五步第一步减232B,第二步变量,第三步时间,第四步啊circle啊circle里面需要注意两件事,遇到表啊Dollar APP遇到日期换成delete啊。
16:14
最后一波执行好。然后呢?要说都是这种事儿的都上。顺报的七七,那这个呢是ADS好搞定,然后呢,导一下数据,ADSUV2019杠零二杠幺幺。
17:19
你们现在在复习以前的东西吗?没复习,现在都忙不过来是吧。啊,这个收藏项目啊,一定一定要敲两遍啊,只要敲到两遍的时候,你对它的理解才不一样,你要能敲到三遍的话,那你的实力就大增了,妥妥的啊。你要光这个跟着老师敲一遍呢。这个体会应该不会那么深啊。我总感觉这些指标由老师去讲吧,意义不太大。看一下。好,那这个呢,是2月11号统计的话,那2月11号日活这些周活,它然后月活一样的啊,然后它既不是周末也不是月活是吧?啊这就OK了啊。
我来说两句