00:00
好,接下来呢,我们讲一下第12章流失用户的一个需求分析,那什么是流失用户呢?流失用户呢,主要定义成这样的,最近七天都没有登录,就认为是流失用户,七天内没有人啊,就在他没有再登陆过,那不管他以前登陆过多少次都不管,只要在最近的七天没登录,我们就认为是流失啊,但是在企业当中啊,这个七天还是有点短的,对吧?啊没哪个呃,一个月以上吧啊,一到三个月啊,我觉得这样的是比较合理的范围哈,啊,你像网上京东上。我觉得我一个月也买不了一次东西啊,但是不能认为我是流失的,这一年怎么也得消费了几次是吧,这不一样啊,好,这是流失用户的定义,那下边我们就来分析一下啊,流失用户。那你现在脑海当中应该怎么去分析这个指标呢?
01:03
哎,最终输出的字段很简单,一个呢是统计日期,一个就是流失用户,统计日期没得说,当前日期二月80号,流失用户看的星就写出来了,那至于这个看的星里面看的星啥。这个火箭,那这里面哎,是slide的含麦D对这个日活进行了一个驱除,对吧?啊,日活先去了一个虫,因为这个日活呀,它只是对当天的数据进行了驱虫,并没有对最近七天的进行驱虫啊,所以说这里面叫先驱虫一下,然后加上了一个having,那就进进一步一个条件是mark,比如说最大的这个日期也得小于几天。这么一个过程啊,那我们来分析一下下面下面这几组数据,比如说设备ID1,它在2月17号和18号登录,设备ID2在2月10号,2月11号登录了,设备ID32月16号登录了,那这里面经过这个条件判断。
02:15
它得是小于等于2月20号再减七,那减七这边就是13啊13号,那么2月16号大于13干掉对吧?好,那这里面它是要求最大的日期小于他,那最大的日期2月18号小于他吗?不小于干掉,那剩下这里面这个数据,那这里面最大的2月11号小B等于13,不小于是不是就满足了。啊,就这么一个含义啊,就用一个分组驱虫,然后一个还有去保定好,那下面呢,我们来具体的写一下。这拿回来。
03:01
给大家写,写了有有感觉了,现在写出感觉了,写了这么多啊,还好,终于我不要写了啊,明天开始就你们写了啊。终于到你了,摩前查转就真的没一天了,Slide,好,那第一个字段呢,是统计日期2019杠零二杠二零啊,然后下边呢,康德清。啊,那下边这一块就是整个这是流失用户的一个判断,来个提行,那下边首先它是针对热活设备ID啊,ID进行一个去除,From dws UV de啊DR表数YD啊去重,去重完之后加上一个还条件啊还条件什么条件啊max date啊,最大的日期它也得小于当前日期减七啊,那就是DATE2当前日期减七减几。
04:29
那当前日期当前日期是吧?2019杠零二杠二零当前日期减。这样就OK了,那这是算出是什么。七天内未登录的用户,未登陆的用户。啊,就这样搞定了,那下面还需要再套一层吗?没套吧。不需要套就OK了,那原来套太行,好,那我们来执行一下。
05:04
啊。这个算算最简单的治疗吗?Com函数,Mini ma,像这些函数啊,面试官嗯,总愿意问你用过哪些函数啊,你可以期待你可以说到的有mini,有ma,有date,呃,Date for,还有last day,还有last day,对吧,还有这个,嗯,Class side,还有我们之前说的这个get,杰森在,对吧?啊,这些函数呢?啊,看着很简单,但是呢,如果你没说出来,那就有点尴尬啊。流失好,那这样呢,就查出来啊,有542个流失啊,流失好,那现在呢,这就是流失用户的一个预算啊,记住它是最近七天没有登录的,那有个小细节呢,就是要先驱重,然后再获利,OK。
我来说两句