00:00
好,接下来呢,我们讲一下第七章啊,第七章的主题呢,是用户新增的主题,也就是说如果统计这一天有多少新的用户,像这种主题基本上就是各大公司必统计的指标。对吧,你是老板,你想想你关心不关心今天有多少用户是新增的,对吧?嗯,肯定是非常非常重要的指标哈,那么来看一下啊,如何来统计这个新增。好,那这是我们建的新增的明细表,新增明细表,那新增里面同样是有这个设备ID号与它去判断啊,去判断它是否这个出现过。那这个跟日活我跟着活跃有一个区别是什么呢?它加了一个字段创建时间。因为只有加上这个创建时间,才能统计出是哪天新增的,比如说今天是2月10号。
01:01
那这个创建时间是2月10号,那他就是2月10号的新增,那我这块变成2月11号,那就代表的是2月11号的新生。好。那所以说只是在日活的基础上加了一个这么抖动。那这要怎么统计呢?很简单。那这里面呢,是像这里面插入数据啊,是来源于哪呢?来源于日活。Left噪音形成这样的。然后。新增的表的ID为空。即为新政。那光看这条语句啊,你现在是一点感觉都没有的对吧?啊没感觉,那下面给大家来一张图啊,看下一张图。看一下这张图,这张图呢,左侧这块就是我们刚才这个向进程表里面导入数据的语句,那这张语句有挪,挪到这边来,那我来看一看,翻译一下这到底是什么含义。
02:09
那这里面假如说这是2月10号的活跃的表。右侧呢是新增的表,那有同学说新增的表,你这刚创建里面应该没有数据啊。是这样吗?嗯,那我假设的有假设的是上一天的2月9号的新政。那我今天是2月10号,我要说2月10号的新政。好,那如果是这样的话,那我就用这个每日活跃去life的噪音起征。那live的噪音的什么特点?左边都有,右边可以没有,那么左边如果有,右边没有,假如说这个10213啊。
03:01
它就属于左边有,右边没有,没有的话右侧。悟空。啊,右侧补空,那么右侧补空就说明他是在2月10号活跃了,但是呢,以前这个行程表里面还没有的。那说明这两个就是。那就简单了,那然后我这里面就得出对应2月10号的薪酬表,然后把它又追加到每个新的列表里面去,就是原来有这么四个,现在呢,又加了两个。如此往复。那现在我们来解决第一个问题。假如说这个新增表。他刚创建就一个也没有。哎,就是2月10号新创建的,那么2月10号就有四个活跃用户,那么对于2月10号的新增用户,就相当于是这四个对吧,那他们摘业完之后,右侧就全是道。
04:06
啊,就这特点。啊,就是用当日的活跃用户去life招引新增的表。那么如果新增表的ID为空。那他就是每日信征。就这么一个逻辑。所以说这个life的噪音很关键,那我们来看一下这个随口语句啊,上面呢是像这张表里面插入数据没啥说的,而且这块呢是创建时间,那就是今天这个统计日期2月10号,那好,那这页呢,就是今日活跃是LA的招音,新增的表啊,新增的表是的之己。好,然后关联条件用ID去关联。如果这个条件里面设备ID号为空。啊,也说新生表里面的ID为空这。
05:02
那他就是新生。啊,以前没有出现过,然后对应日期20号。啊,这个一性呢,是这里面的活跃表里面的啊,就这么一个,就能统计出每日新增设备的明细。好,那下面我们来写一下。在这里面插入数据。啊,那这里面记着这边如果不是分区,那上面就不要有分区了,Nt in,那也就是in into了啊,如果是有分区的话,那这边就变成right啊,In射in对吧,像这张表里面也说新增的表里面插入数据R。来源于select,那第一个mid mid。好,那下面这些值拿来。
06:04
嗯,添加过来哈。这些值我先不说了啊,属于这种公式的。好先放那一会再处理哈,然后下面这有一个创建时间,那是哪天创建的啊,那就今天。2019杠零二杠幺零。刷牙器。啊。然后from是每日的活跃,那活跃的话是DWUV。Detail,对,每日新车,那这个简写呢,就是UD啊,U和Du首字母,然后他去like呢,这。那得差谁呢?它是几。每日新增啊,然后NM取个表面字。
07:03
那他们的条件是二。二呢,就是UD的。点是白的。等于NM点什么ID这么两个,然后Y条件。又地,也就是说,这个活跃的日期得是二月。第它得等于2019杠零二杠幺零,比如说在这天活跃。然后切这个是关键,切这个新增的ID。第二,M mid,它必须得等于now啊,Is啊。啊,那就是这个新增用户就搞定了。对吧,那下面呢,我们来测试一下。那这块这个mid这里面也有,这里面也有,那就会报。
08:04
报错误吧,哎,那是不是随便给个哪个哪给哪个都行啊,给一个好OK,运行一下创建表。搞定,然后右边。运行啊,这就是算这个每日新增啊,每日新增的条件呢,就是每日的活跃去life的招音新增的表啊,如果新增的表的ID为空,那就是每日新增,比如说在面试的时候,人家问你如何算的这个每日新增,就把刚才那句话说出来就OK了。如果刷完之后我来查一下啊。好,说完了,查一下两新的。
09:05
那这里面呢,是753啊,每日新增之前我们算的这个活跃是不也是啥呀啊,那其实我们2月10号它既是新增又是活跃,因为新增表里面以前是没有的,OK哈。好,那这个就搞定了。
我来说两句