00:00
好,那接下来说一下啊,咱们接下来的作业,咱们在后天的时候啊,一来大家就开始给我敲代码,敲什么代码呢?从抵达大学城用户行为宽表历直敲到第三个需求结束,也是6.4结束,包括6.4这代码也需要绩敲啊,全部完成历史时间一天啊,上午就是需下午呢,要求每个组派个代表去讲不同的这个对应的需求。好,那这里面稍微看一下,这里面涉及到了一个DWS用户行为观点。那建议用行为发表,你看啊,首先这里面的字段包括用户ID,下单次数,下单金额,支付次数,支付金额,评论次数,那么这么多字段,看前三个字段来哪。是不是下订订单呢?那下面支付支数支付金额来源于支付表,评论支数用户行为呢?评论表是不是来源于多张表啊,我这里面只是拿三张表示力,那分析这三张表的时候,我们可以引入另一个技术叫with time。
01:11
啊,Way type的as,这相当于创建了一张临时表,那你看这里面处理的事情,Way type订单sla藏了一张订单表,订单里面的ID,订单里面的次数,订单里面的金额,好结束,然后这个很办,日期是这个当前年月日,这个日期啊,不办,然后之后这个是支付表,支付表里面这么多信息查查啊,然后继续处理这两个字段,那再之么,这个呢,是评论表,评论表的信息处理它。是不是感觉这个很清晰啊,啊一张表去输入一张表,然后下面呢,这里面是具体的啊,向这张表里面去插入数据,插入数据的过程当中是上面这三个临时表,你说这三个临时表。
02:01
进行了一个结果的聊。对吧,所有结果放在一起啊进行累加,那这里面要有一个注意的事项,注意什么呢?第一张表里面的所有ID都要去给它起别名啊,比如说user ID啊,User看啊是偏零的啊,偏零的地方要这个起别名。那现在大家可能没感觉,你看这里面,我这是五个字段呢,这多少字段,我是六个字段呢?六个字段,那么这个time order里面它能提供几个字段,是不是只能提供三个字呢?那你说三个字段有值,你看一个两个,三个,那剩下的没值怎么办?天零五位。啊,然后之后你下一个就是下一张这张表里面,它有几个知道能用到的。这是几个一个两个三个其他ID的话,是不是就两个啊,其他部位不零,还有那再下一个,这里面是右是ID,然后平段ID计他为五零,这种方式去去计算,在企业开发商大量使用,好现在呢,可以给大家看一下企业当中代码怎么写的。
03:15
七中代码啊,企业中在。好,那刚才看完了啊,这是企业单位代码啊,就这么玩了啊,不难吧,然后希望大家啊,这个建表语句,日后你再敲的时候不需要再敲,然后下面这个导入的过程当中,这些东西需要你现场营销啊,然后后面呢,这样你们需要在做的就是这个建位啊,成交总额啊,成交总额。那这里面其实你可以看一下这里面的描述,其实就是算一些这个订单总金额,那既然就是订单总金额的一个累加求和,那这里面遇到的技术呢,就是上呗,是吧,求和不就上嘛,啊各种上啊,那后边还有一个呢,是这个转化率及各本分析,那转化率只要涉及到什么什么率就是谁除以谁啊谁除以谁,那这里面就是萨姆求和烷一除。
04:12
啊,去完溢处就完了,那你看这里面引用的方式,就用到这个是这种补灵的方式啊去做的啊,可以采这种啊,有牛啊好,那再往下看的是这个漏斗,漏斗分析啊,也是求这个相等转化率啊,那这里边同样用到的是sum啊萨这里面只不过有一个萨if some if什么呢?他求的是那个下单的人数。那下单的人数,他有可能下了N多单。那它的是只要它大于零,那么只取一啊,这个是想要有啊,这是它核心的东西,好,那再往后。之后呢,是品牌的复购率啊,那这个品牌呢,就是他买这类商品,比如说第一次购买的人数这是100,这是200,然后第二次购买八十一百二,那它单支复购率就是80%,60%。
05:07
啊,第三次购买,购买了五十四十,然后复购率多少。啊,这么一个过程,那其实这里面用到的记录点呢,仍然是这个萨姆if看见没有啊萨。哎,不是萨衣服了,这个里面。呃,这里面用到的基础,呃,就是一个sum求和呀,那就更简单了一些,萨的一些,呃,一些聚合啊,一些算一些值啊,非常简单啊非常简单好然后之后呢,是用这个啊不是啊,这个没没有在在这用上衣服了啊在这。这个啊,比如说最终这个落地N成代码呢,就是那个sum if,看它判断它购买一次的人数,购买两次的人数,购买三次的人数,你看大于等于三,那才记一啊,大于等于二记一,那是购买两次的人数,比如说这个地方算什么时候是人数的时候,其实它是用这个组格啊来做的啊,那后面呢,还有一个是每个等级用户的复购率前十的一个排行,用到了开窗函数,那这里面呢,呃,给大家提供了一个参考代码,但是这个参考代码呢,是有bug的。
06:22
那为什么有代码有bug给大家呢?在这里面。啊,目的是让你你要能把这个bug改出来,那就说明你对它理解到位了是吧?就这么简单啊,这里面至少有两处bug我可以告诉你,那你看你能不能找出来啊好,那现在呢,这个任务呢,我已经说完了,说完之后下面我们一共有四个组,对吧?啊四个组那我分配一下,最简单的是GMV啊,分给谁呢?嗯,地主前强大了,哪个主人少?第三场第三种市场是吧,第三种啊,潘代表讲一下GMV啊GOK啊,第二个需求,第二个需求当中的这个用户活跃率,嗯呃,用户新增占活跃率的一个占比,交给第四种,第四个原因不是特别多啊,第四种这也比较简单,然后呢是用户的行为的漏洞分析。
07:22
那这个给第二种啊,第二种啊难度不高,那接下来啊最难的。给第一组啊,第一组啊,第一组实力强悍,那这里面呢,有一个啊,额外的还有一个用户等级行为分析,交给咱们的项目经理啊,谁呢安宁同学啊,他来讲OK吧,啊这么一个顺序,那这里面在讲的过程当中啊,后面咱们是要打分的。啊,你们是自己去打分啊,项目经理啊,比如说这个一组的人啊,来讲这个东西,那么234组的项目经理啊,一个金组长给他打分,那打分最高的,到时候这一个组每个人一名牛。
08:03
啊OK啊,所以说你们一定要派出这个最强悍的啊代表啊,没人听对啊,最强悍的啊,同时呃,在明天后天后天上午九点过来,咱们就开始从这个用户行为,呃,不是从用户行为就从这个宽表行为开始往后敲啊,往后敲代码,那么哪一个组全部做完,每人一瓶红酒啊,这个组内部的人每人一瓶红酒。啊,OK吧,啊,所以说啊,大家认真准备啊。行那。
我来说两句