00:00
好,截止到目前,其实是我们把第一章到第八章啊,整个书仓的搭建,包括指标的分析啊,基本上已经跑通了啊,跑通了我们用的是2月10号和2月11号的数据,那下面这些指标呢,其实是我们后加的一些指标啊,也就说在企业开发中呢啊,还有很多很多的这种指标啊,只不过呢,这些指标呢,是非常有代表性的啊,所以又给大家呢加进来了,但是呢,加这些指标,那你要想算的这个准确的话,需要再加两个日期的数据,分别是2月12号和2月20号的数据。那这样的话,你分析下面这个指标就会好一些,因为呢,它是一些跨周的啊,还有这个连续三天的啊,等等这种指标啊,相对来说是比较复杂一些了。在以前咱的面试过程当中啊,面试官总问分析过哪些复杂的指标,也有同学说我分析过是我啊,我分析过新征啊,面试官一脸鄙视的样子是吧,你天天就写这这几个指标啊,还好意思跟我说这个比较难啊,那当然了啊,后来教大家说这个刘存啊,留存还好啊,各位应该吧,还能接受,但是你不能天天都算留存吧,对吧?从第一天算到180天的留存,那一一周也差不多写完了是吧?啊,那之后的日子那肯定是不行的,那这里面就涉及到一些复杂的指标,尤其是这个需求期和需求八。
01:32
它就属于这种连续的指标,之前王老师也给大家讲过这个蚂蚁金服吧,诶郭老师讲的吧,啊郭老师讲的啊,蚂蚁金服这个啊,涉及到了窗口函数和开口之间的一个结合,类似于这种指标在企业当中分析的还是蛮多的。啊,一定要注意哈啊,那今天呢,再给大家啊,把这个第九章的数据啊准备好,也是照一下2月12号和2月20号的数据,那这个就基于我的进行去改了哈。
02:04
首先把这退出。那集群我现在的,因为我之前说过,他是往后加了一个日期,是不是还好啊,嗯,他你要是这个日期,比如说现在是你看现在多少啊。这个512的,那完了,那肯定要班集群啊,新班集群。他这个服务器时间是不是自动跟这个,呃,就是互联网上的时间进行通过自动通过啊,只要你在联网,它就是各种时间。同步的时间还是很准的哈。他自己通过了自己,他只要能联网,它就连公共的这种时间服务器啊,把它给更新到当前最新的时间啊,类似于对表,就跟你手机,你的手机的日期是不是一直跟这个都很准的啊,这个是一个道理啊,那肯定的,你要不联网,它永远都统计不上。
03:14
可以有啊老师这个应该是有桌面系统,所以说自带系统。我这有桌面,我这有桌面。你肯定有主件去管他嘛,没有主件管的话,他怎么可能是吧。好,那这个呢进行停掉,停掉呢先改日期DD2019杠零。杠零二杠幺二啊,先做12号楼行。好,这样呢,这个日期就改过来了,改过来之后下面呢,再重启集群。
04:14
把机器可以逐渐打开。这是12号。那我后面的日期还得改呀。我们后面也要用到12号,那个不是那个是业务数据,业务数据12号。对,进来了啊。嗯。你看都被冻感冒了。班长,晚上得盖被呀,不盖被就行啊。是吗?净睡觉不盖被。好,那这样呢,这个就启动起来了,启动起来之后呢,我们来上传视距啊,那个行。
05:04
系统完成,我们来观察一下这里面数据。得等一会儿啊对,有一定的时间。好,有了2月12号的数据过来了,看了啊,然后我们来推出来看一下这个topic。放掉了。慢了,应该不是慢的问题,那个top。来啊。进行关闭了。那天我也碰到你这个问题。
06:00
我先把。集训过完了之后再改时间啊,我又去年就又一个事件,另外事件记占用方案一下。文件名三反。我看一下啊。看一下这个c do table的pro有这个日志啊。这里面有topic start,并没有event。再一下。你就先做密集群之前先把时间调过来,然后就。启动。
07:00
是吗?那我试一下啊。把那事先删了,那的那的现在不行是吧,不行的话,那就先让他说的,那我再停再再停止一下,再再开时间。时间已经改完了。他这个这种哈,你不用担心,因为咱们目前是造的测试数据是吧,因为你在生长环境下,或者是你的测试集群上是不会去不会去这么去调的时间的,一定要记住啊,不要不会这么调的啊,不用担心。因为咱们这属于这个。破坏这个环境。它底层是靠这个时间去一些通信的啊。还好这个能耽误点时间,要不然这一天没法讲。
08:02
还好,出去。赶紧下课。太冷了,脾气不需要拥抱一下。还是美女,美女的拥抱,立刻就兴奋拥抱7426。这是新的问题啊。汪老师代表的学生都是。好,那这个呢,OKOK之后我们再写一下啊写一下。这回应该用大哈启动完之后,我们就把那个原来那个数据给删一下啊,它XX杠二。嗯,道理。
09:00
光。开。他下的所有。不删也行,但是太胖了。我看看。嗯。今天呢?现在删了吧,好,这个删掉了啊。发一下,嗯。删掉删掉之后呢,下面呢,我们再来运行一下啊CD。删一下,这里面有一些数据,RMS号RMF。泰二四就删掉没看到。好,LT加2377。监控一下。
10:12
哎,差不多了吧,是不是都有了,这个都有了。刷新这个呢,2月12号数据也就有了,然后我们来看一下一本的。一到2月10号都有了,OK哈,那这两个有了之后,我们就先来这个去倒一下。就是监控那块。先不弄了啊,先不弄好,那这个启动完之后啊,对应的生成相的数据,然后呢,我们就要求我们从ods层一直往上导,导这个数据导到哪呢?导到DWS层。啊,达到电压层之后,后面的话我们再用就可以进行自己的处理了啊,比如说后面这些指标,我们需要用到这些数据,一层一层往上导,那好吧,还好我们这些有脚本。
11:07
即使在以后的时候,我们还用这么去执行吗?想想。怎么去执行呢?我们是不是有阿了呢?或者有无这个,哎,那就不需要我们人为在线去导了哈,全部是自动化流程我们去导了,等我们到第三个文档的时候,就全部用这个阿去完成,就到第五个文档的话,你可以选择用屋屋去导航。嗯。技术发展到一定程度之后,你会发现越来越简单,越来越容易,就跟Java是一样的,好多东西都有成熟的这框架,对吧?嗯,拿过来就能用。你看什么是,就比以前的SSM就容易多少。
12:04
有什么配置?啊,到时俩出去。总感觉造型像拖地雷似的,总感觉你像拖地雷似的,太虚了,主动承认呢。一场一场搞。是他的五月有必有冤情啊,是吧,五月飞雪。
13:04
对他来讲很快啊,很快就打完了。咱们班今天可以稍微的呃,缓一缓脑子啊,因为明天还有一波硬拆的啊,硬拆啊联系指标嘛,是吧,今天晚上你可以提前看一下后面的连续指标到底怎么去分析啊。然后顺便复习一下窗口函数是吧。据说其实不错。班长学的好。班长干啥不好,只要是晚上就行。速度快,你看欣欣是最有发言权对吧?真的是数量为啥都是零?
14:10
应该是吧。最终我们来看一下结果啊。好,然后再来预备。是零的。成功。这个时间啊。传承的为零。有一会看一下,应该是OS没导成功,才你点导成功为空的情况下,他才会一个切片一会查一下。咱们俩。
15:03
这都时间。这是DWSUV,看一下。查完之后查一下表。对吧,像这种版本查数据。好,擦完之后呢,我们来起一下have。好。导数据没什么这含量啊,但是你们在企业当中啊,啊导来回导数据这个这种活啊还比较多啊,最典型的就是需要你把这个MYSQL的数据导入到手上,把猫DB里面的数据导入到手上,把Oracle里的数据导入到手上。但是呢,这几个当中,你们最熟悉的就是买的数据导入到手上没有任何问题,对吧?啊,基本上学生也OK,但是呢,只要换成Oracle那完凉凉对。
16:13
百度有同学连安个那个安不上,我也不知道他是怎么的。就是一点这个。呃,扩展能力都没有,基于反差能力有。有数据了。差不多了,毛线行,那这个呢,2月10号的数据我们就倒过来了啊,2月12号的啊,2月12号数据导过来之后呢,下边呢,我们来处理一下2月20号的数据,那要切换一下日期,我们可以先试一下,第四呢,也许不用重启,因为它是往后的儿媳还好请。
17:06
好写好了这个2.2层,然后呢,现在呢,我们就继续来上传数据log中。上传完了,我们来查看一下这个这种情况。嗯,这里面已经没有了啊,可清楚了。搞定2月20号。哎,2月20号数据来了,然后呢,我们再来看一下这个to一个start,看这里面有没有。他为START2月20号也有吧,啊那这样这个数据OK了,记住哈,它是time的时候,你不要去导,它导也导不成功,它不允许你去移动修改的,那等它是诶这种情况啊,属于可以操作了。那下面呢,我们仍然按照这个对应的脚本啊去生成ods。这。啊。
18:04
然后这两张表。这个算快的,后面我们在导这个业务数据表的时候啊,领导领导八张表,那个时间就比较长了,应该将近20分钟左右啊。那还有你看现在为什么要让大家去看到这个导呢?因为面试官啊,他会问一个情况,说你每天把买里的数据导入到he里面,用多长时间。是一个非常简单的一个问题。然后呢,你会发现,哎,我我不知道啊是吧,编一个,那你说多少,你编了多少,你编个三三个小时四个小时还是五个小时。对啊,这差不多啊,半个小时到一个小时,那至少你合理范围内对吧?啊这就OK了,但有同学他就没感觉说那话说五个小时啊,导个数据,那后面指标不用分析了是吧。
19:04
其实这些问题你说难不难呢?不难,但是你说你能不能想得到呢?有的时候还真不一定。就跟我,我跟你们之前说的一个学生去面试,突然间就问了一个,这个哪一个商品卖的好啊,直接崩溃了,就这一道题崩盘了,前面答的都非常好。说不知道。那正常情况下怎么可能不知道呢?是吧,是不可能的,天天分析这个指标,而且你公司谁哪个卖的好,哪个挣钱,这是肯定知道的啊,你是掌握第一手数据的。那从现在开始,你们就要去留多留意一些这个手机上的这个应用啊,啊看看你们是老板的话,能分析哪些指标,嗯,你能用它去干什么,同时呢,写一些博客是吧?啊写一些心得体会。
20:07
今天开始直播课啊,昨天不就说了吗?提高一下自己的名气啊,然后呢,相互点个赞对吧,里边这么多人呢,一下子就二十七八个赞,闹呢,每天27个赞。你要是地上一下27颗星,那多厉害啊,对吧,那就是大神了。好,最后一个。搞完之后查一下。华的这个。据都是跟大那都是相关的呀。啊,我要查日期,我加个日期好了。
21:01
我得加,刚才没加吧,加。一个是你们家日期,还有我们有啥疑问的,有有没有导致过。迈尔,DT就是DT。得有数据啊,有数据没完了,嗯,有是有啊,二月号年底啊这个。我就要那就行了,因为我后面所有的指标只关心那的对吧。Select形from。等于。2019杠零二杠。120。等待吧。好,那这边跑了查一下,那是不是这边人有了啊有了。
我来说两句