温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
好,接下来呢,我们开始讲这个大数据数仓啊,那先来讲的就是这个用户行为采集这个阶段用时时间两天啊,两天这两天呢,主要讲是这五章内容啊,第一章数据仓库的概念,这里面涉及到一道面试题。两题啊,那我给大家说一下我这个讲课的这个呃思路啊,啊,我从两个方面去讲啊,一个方面呢是面试题,一个方面呢,是从这个企业开发啊,项目角度,你要敲哪些代码啊,要会哪些东西啊,这么两个方面啊,一个就是如何来日后应付开发一块呢,是如何来应付日后的面试,开发和面试绝对是两套。啊,他们的套路不一样啊,然后给大家讲一说,行看第一章呢,就是书商概念啊,有一道面题记住就行了,那下面第二章,第二章呢是项目需求及架构设计,整个第二章完全是按照这个企业开发的这个流程去带大家去一步一步的去分析啊,那这时候呢,非常非常重要啊,我会带大家从零到一去分析一个书上的搭建。
01:10
接下来第三章是数据生成这一块啊,那这块呢,我们是采用这个自己去造一些数仓的数据啊,用于我们日后的一个分析,那这里面呢,我们会造八呃12张表。12张表的数据啊,12张表啊,满足一个中小型公司的一个要求啊,非常主流的,而且这些表呢。都是完全来自于企业,甚至一个字段我都没改啊,可以这么说啊。很重要啊,那下面呢,这块呢,就是用那个加代码啊去生成啊生成。那第四章,第四章呢,就是整个数仓通道的一个采集打通,那打通的话,首先这里面涉及到有开框架啊,有主keepper,还有from有卡啊这么几个主流框架,那在讲这些框架过程当中,诶你看这里面带有那个项目经验,那这个项目经验这些东西是哪来的?
02:09
啊,全部来源于企业老师啊,企业的项目老师这里面包括啊,有目前的这个像呃TCL的啊,就深圳这边啊TCLL老师的啊,还有这个目前像这个呃,杨冲杨冲数学啊,李国龙老师啊,他干过五年多的这个大数据架构师啊,绝对是架构师级别啊啊那后面那这些东西都是他们在项目过程当中啊用到的一些经验啊,我就给加到这个项目学了啊。好,那这时候你要认真听,同时这里面还涉及到啊一些面试题啊,无论是项目开发,还一些面试题都给大家去讲解。那最后一章啊,第五章这里面总结了你前边所有学到的这个技术点啊,要带大家去把这些东西搞定,同时这一块还会带着大家去复习一下以前所学的框架,那sell keep from。
03:06
比如说,你应该掌握到什么程度,就能应付开发和面试。啊,就这个角度哈,好,那这个就是我们整个这个用户行为采集这个文档啊,我们要做的事情啊。
我来说两句