00:00
好,接下来呢,我们开始讲第十章,第十章往后啊,这都是咱们新家的这个需求啊,都是目前企业当中比较主流的需求,那第一个呢,需求呢,就是这个沉默用户数。沉默用户,那我们来看一看这个沉默用户数是怎么定义的,沉默用户指的是只在安装当天启动过一次啊,而且呢,这个启动时间是在一周前。这就非常典型的,你们之前在大街上被人抓过去了,说这个扫码送礼物,扫完码之后就再也没能够管,而且这个时间超过一周。那你就会被认为是成为。啊,这边那基于这个怎么去统计这个成功用户数呢?想一想有什么思路。首先它只启动过一次,现启动的时间是一周前啊,一周前好来看一看这么两个点啊。
01:10
概念,然后下边呢,这是我们即将把这个沉默用户数进行可视化需要的字段啊,这里面需要两个字段,一个是哪天统计的存么用户,另一个呢,是这个沉默用户总数,非常简单啊,那第一个值怎么花钱?直接开始就行了,对吧,直接填一个当前的日期,比如说2月20号啊对应过来,那另一个呢,是这个沉默设备数。那最终就是康德星呗,啊,最终一个康德星就求出来什么用户,那下面这一块就是围绕着这个沉默用户去运算,相当于就是指查询。好,那在这个紫查询里面做了哪些事呢?第一件事儿,我们先优先,先写的就这块儿。首先对的是啥呀。
02:01
是不是日活呀,哎,对这个日活进行判断,首先这这一步其实可加可不加啊,加上的话就是更严谨一些啊,或者说这个先过滤了一下,过滤一下是小于二二月20号之前呢。啊,之前发生的,那加上数据量呢,会小一些,然后呢,葛若白为了干什么?是驱虫啊啊,因为我这是日活对吧,那日活我要算一周前的数据。那我就把一周前的这个日播都拿过来,那就涉及到一些重复性的问题,对吧,所以说那这块呢,先对它进行驱虫。那去完成之后,你看一先分组啊,分组系轴,那就相当于对应的四倍1ID4倍二四倍三。那么这个IDE假设说他在2月17号登录,我2月18号登录我。那么。
03:01
他能要吗?啊,你先通过这一个条件能要吗。目前还能要吧,啊,这个条件目前还OK对吧,然后这个呢是2月10号也OK吧,啊2月16号也OK,然后下边加了一个。也就是说,在这个分组的基础上,靠心对他们进行抗清。我们要总数为一的,因为只是在安装当天启动过一次,所以说我只要。有一次记录了。嗯。那这里面你看星出来它两次一次一次,那它是不是就干掉了哎。那卡里被干掉。他有点胖,那再往下。那这里面还有一个启动时间是在一周前。一周前,那你说这里面的时间必须是在一周前,也是小于等于2月20号的,再往前推一周。
04:05
啊,等于周线,那就是这个mini知道啥意思吗。啊,它是一个串口函数,取这里面的任何一组的最小值啊,最小的日期啊,那有同学说你这里都是一个了,就不需要取了啊,不行啊,因为它这里面是在类似一个窗口啊一个处理,如果你不加它这用函数的话,那它因为你前面是有个分组,下面必须得用均用函数啊,你不用均用函数直接报错啊,这报错啊,那这里面取出最小的值,然后它得在当前日期的。一周线对吧,小于七天OK,嗯。那他他是2月16号,我这是2月20号,一周前就包含他了,那把它干掉,那剩下的就是2月10号。
05:02
稍微回顾一下。首先是这一块先分组驱虫,因为我们这是日活啊,它并没有驱虫,那是活驱虫,然后分组,然后那这个主内只要求有一条,因为是只是当天启动波对寸OK啊,那你一看到星发现有两次了。干掉。然后要求这个启动时间得是在一周前。啊一周前,那再加一个按照条件,比如说这个面积类呢,最开始的那一天必须得是一周前啊,其实它就一条啊。OK,干掉,那这个呢,就是这个沉默用数的一个分析,那我们来看一下。啊。
06:01
那下边我们向这里面插入数据,呃,ERP因这移动对吧?啊,向这个里面插入数据啊,那这里面两个字段,第一个字段统计日期,那就是当前日期2019杠零二杠二零。OK,那下一个呢,是这个成的设备数啊,那成本什么数呢,肯定是要汇总的啊,那就看的清。啊行,那下边所有的判断都是围绕这个怎么用户数去处理的啊是吧,那这里面来了一个只查询,这里面专门来处理成本用户。那好。那成本用户数首先要对这个活跃用户进行分组,去除slide mid。啊,From日活对吧,DW UV dtl d,然后这啊,然后可以提前过滤一下where条件DT小于。
07:16
小于是2月20号是吧,2019杠零二杠二零是吧?啊小于这天好,然后再对这个设D进行分组去除啊入100D。这样呢,就把这个设备相当处理成这是设备ID1,设备ID2里面对应的日期一,日期二,日期一啊,这是ID。ID进行分组了,分组里面是日期,那对这个日期还得进行count,我们只要有一条的那这块。还没?还没放心?
08:04
等于一条交一条。然后还加上还加什么。日期是吧,啊,日期得是啊,七天以内,那就是DT小于等于这个。七天以内减七啊,减七那前面。前面直加七是2019杠零二杠二零是这样吗。啊,对,这个加上啊,要不然报错了啊对。是这样吗?啊,那这样还能怎么算。可以吗?
09:00
也差不多了吧。就这样啊,就搞定了,那搞定之后我们来测试一下啊,我们先不讲这个面积,你可以感受一下啊。你看数先这俩。CD model。你行啊。现在呢,就是大把大把的写生。20号的兄弟能出来吗?这个。20号。20号他肯定我不要啊,因为他是一周前呢,要不要的话。二号登录一周前呢,我要一周前呢,就是今天登录过了。
10:05
然后,然后你上一次登录是一周前。啊啊,那可以加上啊,要要要加上啊可以这说对啊,就是说防止今天他登录了是吧?啊可以啊可以。没问题啊。严谨。好,要的。好,然后呢,下面呢,我们来见一下这个表,表里面两个字段统计日期和设备成默认用数。OK,然后呢,我们现在来演示一下啊,看看他报什么错啊,他一定是错的啊,来感受一下。要多尝试对吧,这样印象呢,能深刻一些,它现在提示你的18,呃,12行第八列这个解析is,什么not in group p析是吧?啊,其实就是分组函数之后要用的都是聚合函数。
11:03
好,那下来之后我们再来比选一下。上。啊,走。这样呢,就跑起来了哈。其实不是特别难,这里面首先呢,是要对这个日活啊进行分组去重啊,如果这个那你不加这个也没问题啊,不加这个直接就是分组驱虫,然后找到里面啊,只启动过一次的啊,这个关键开po等于一次,同时它的日期。得是小于一周前啊,这么两个条件就搞定了啊。
12:01
啊,查询一下from这两个。抢贸易魔术。嗯。那这样呢,就查出来了,2月20号有65个承诺用户数啊承诺用户啊,因为之前登录过啊,后来呢,啊,一周之内没有启动过,OK,承诺用户数。
我来说两句