00:00
好,现在呢,我们是把买生的数据导入到了这个as啊,我们现在呢,可以看一下啊,是否真的导过来了,还等会50070。然后看一下,因为呢,它从school啊,通过库把数据导入到我data的gma gma下的DBDB下面有八张表啊,随便点一个看一下啊,这里面有20号和21号的数据啊,这些都有了,找过来你再看下别的。那详情2月11号,比如说这里面的数据呢,都已经进入到对应的啊N天板上,那剩下的事就是我们接下来做数仓啊来做了,那数仓的话,首先就是这个ods层啊,那ods层它的特点是仿照业务数据库程表格字段一模一样的建立ods对应的表。那我点来特点是保持数据原貌,不做任何修改,是这样吗?啊,那么把这个EP导入到have,运用到的命令就是load date,然后pass啊,In pass,然后具体的输入文件路径,然后into table,表a table,然后具体的表名字,如果有分区指定part是这样一说了吗?哎,好,那现在呢,是不是现在这容电源建表啊,那连续建八张表啊,建八张表,这八张表的字段跟我们上边第一张提到的这八张表的字段一模一样啊,一模一样啊,你看用户姓名,生日,性别,邮箱,用户等级创建啊,包括分区啊都已经指定了,然后同时还指定了存储的位置啊,往下你看啊,一级分类,二级分类,三级分类。
01:59
嗯,然后支付流水。
02:02
保持数据源吗?没有专正的修改啊,就是原来在把信号表的结构是什么样,那这边就什么样啊,拿过来一个个创建OS。还启动了。没有是吧,啊cdd water have have。Mother。你们启动有这么慢吗?没有啊,别气我。我在给顶配电脑。真得换了,我看延迟。
03:01
有的禁卖了。好,接下来第一张表创建完成,然后第二张表。搞定第三张表。第三张,OK,干掉。第三张表搞定之后,接下来第四张表用户表这种就很简单了啊,你你感觉一下跟我们上一个。用户行为它并不是一个级别的。好用行为,那个是最复杂拉的手。拿过来,所以说这样就导致你什么呢?去企业当中,你能建ods表的机会不多啊,基本上都是直接到那个DWS层了啊,或者是DWD层上做一些数据清息。
04:07
啊,这种活必要用啊,好,那现在呢,我们就把发张表建完了,那剩下的事就是从文件外数据导入到蓝色里面,刚才我说过用到的命令就是long date pass,然后原始程序的路径,看我身data APP指的就是面账号DB。订单表,然后日期our right into down table or in for part对应的按照日期进行分区。啊,就是每个过程哈,那这里面啊,一共呢,是对应着八张表的一个导入过程啊,其他地方都是我们严格按照之前的啊,五步井号三二啊变量名称时间,然后circle号自行车口啊没有任何变化啊,那这个呢,就拿过来直接去导出去了啊。
05:07
CD。没有什么新知识点,跟用户行为那个第一层一样啊,倒过来。是什么信息,这个呢,是ods ods DB好完事之后下面呢,我们开始先导一下2月10号的数据啊,这个很快啊,很快找。2月10号如果导完的话,我们可以查一下20号数据,看看是不是有啊。
06:17
这么慢。After。就是启动吧。因为他技能太好。好,那等完之后我们这边查一下,看有没有数据,有数据就OK哈。啊是是有数据啊,啊有这个数据,然后下面那我们再导一下2月11号的数据是吧。啊,这边可以再换一下啊,这是。二月十二二月11。
07:09
今天晚上都谁在上自习啊?都这样能吗?你先等吧,吃完饭都跑了。好,2月11号搞完了,我们再来查一下2月11号,哎,那这里面呢,也有对应的数据啊,就OK了啊好,那也就是说OD我们都已经导完了,把2月10号和2月11号的数据啊导OK了,那这里面其实用到的就是这个load data pass,把AD数据导入到MY啊,导入到have里面。
我来说两句