00:00
好,那下面呢,我们来看一下业务数据的生成啊,之前我们在照用户行为数据的时候,用什么照的写的Java代码对不对?哎,然后用这个log把文件把数据写到。文件上啊文件上,那现在呢,我们是直接通过这个啊存储过程啊,把数据写到了MYSQL数据库里面啊,造一些假数据啊,那我们把这个生量要打开。啊,打开那这一盘连接呢,是我的主器名称F102啊,因为我的MYSQ在102上,然后应用名root密码六个零,端口23306,看你的买克包在哪台服务器上,你就连哪一个连接。好,连接上了,连接上之后,我要在这里面创建数据库,那创建这数据名称呢,叫G啊,就叫g ma法啊这么一个数据库,那创建。
01:06
对吧,然后呢,这个编码集选的是utf杠八,这诶错了这个,然后下边这个是gene。这个啊,在这一个C啊,OK,创建啊,这样呢,就创建了这么一个买车库数据库,然后呢,带着大家去看一下啊,后面我们要执行对应的脚本。资料,资料库里面有一个数据库,生成脚本进来,这里面对应的四个circle分别看一下里面是什么。打开。都是建表语句第一个二在一份订单表对吧,那大家有没有感觉我这个这单表里面好像。比咱们文档当中的多呀,有这种感觉吧,啊是这个呢,是真正的这个企业开发的时候配置的一些字段啊,字段含义啊,我只是抽取出其抽取出其中一些有用的字段啊,如果太多的话,其实你也记不住啊,那如果我们日后在分析一些指标的时候,或者说呃,面试官问你一些呃,更复杂的业务,那你可以把这些指标啊字段加上啊就OK了啊好,这是订单表之后。
02:26
SQ是商品信息表啊,商品信息表再往下new专业块用户表,用户表还有order detail订单详情PAYMENT1份,那属于支付流水好,一级分类,二级分类,三级分类,是不就建了八生表。啊,那这个情况呢,把这八张表呢,放在一个文件里面,执行这个circle口啊,当然你一个一个去删复制是不是一样的啊是一样的哈,好,那这个建完表之后,下边是该项,这个表里面插入数据再打开。
03:05
啊,那看。这个我们我们先处理的是一级分类,二级分类和三级分类,这些数据都是爬其中的,看一级分类都有哪些。18个分类,包括读书、手机、家用电器、数码在列这么多,比如说每一个编号编码代表了一个信息,那再往下二级分类。那二级分类看。这是二级分类,那二级分类这同样是左侧是编码,然后二级分类的名称,那右侧类呢,一级分类的ID啊,一级分类有18个ID,就说右侧有18个,好,你看你看二级分类有多少。这个车爬起过来的啊,抓取的非常真实到这。125个二级分类啊好,那再往下下边呢,就到了三级分类啊,三级分类ID名称,然后这个呢,是二级分类的对应的ID。
04:07
给哪这里面拖着去了啊。1149个啊,是五问七是吧,矿器啊,那这样你看125啊,这就是一级分类,二级分类,三级分类啊,它的数据形式就是这样的,那我们就通过这个insert的方式看insert into嘛,往里面去插这个值就OK,后面呢一执行。好,那剩下的我们还有五张表,那这五张表呢,就要造一些啊,一些实际数啊,还有一些特殊的内容,我们打开。那这里面这个呢,就是主要是创建学习函数啊,那比如说你看create啊,什么一个函数,这个名称呢,叫round number啊,然后再往下,这里面又创建了一个函数,叫什么round number啊,然后再往下。
05:01
叫round numbers。转的使劲啊,随机的使劲没了,比如说这里面定义的这个函数都是用来做随级数的。啊,是一数的啊,当然这里面语法你不需要了解啊,不需要了解啊,就是照一些假数据了,如果你不用这种方式去照,你可以用哪种呢?直接写Java程序生成数据,把数据写入到呃构里就行,也就说把我们用户行为那个产生数据的过程没问题,只不过原来写的是文件,那我们需要把它分支写到MYS里面,是不是一样的,那连接MYSL一个JDPC是不是就完事了啊,连上往里写呗,各种插入好,那这呢是相当是差数,那最后再有一个存储过程脚本。啊,存储过程,那就是具体的向某一张表里面去。
06:00
S数据啊插入,那比如说第一个你看它处理的谁呢?Ins射的SQ,像商品表里面插入数据啊,然后in射的user向用户表里面插入数据。之后insert order向订单表里面插入数据,在之后update order更新订单的一些数据之后insert payment支付表里面调数据啊,就是造一些假数据,在造假数据过程当中用到了大量的流转啊,最后还有一个叫1亿的类,那这个1亿类呢,是最终我们调的这个函数啊,就相当于内方法,那在这里面呢,它有一些参数啊,比如说today的实例啊,然后是order increase number的。啊,还有这个user什么什么啊,这个参数一会再给大家再解释,就相当于是可配置啊传进去我要生成多少个订单,我要生成多少个用户,我要生成啊多少个这个呃。
07:08
啊,是否删除原来的数据啊等等,是否清空好。那我们先来一步一步执行。回来,回来之右箭。打不中。执行车。按照顺序去执行,第一个先见表执行。哎,执行完成OK,然后你可以刷新一下。那这里面就有对应的这么八张表啊,那目前呢,这里面是没有数据的啊,你看没有数据,好,那下面继续往里面插入数据,先插入这个对应的三级一级分类,二级分类,三级分类。啊,这些。完成完成之后,那这块你刷新一下。
08:06
哎,出来了对吧,那这里面这个对应的数据了,你可以再刷新啊,刷新好,那这。对吧,啊,数据就有了,三张表有了之后,那下边呢,我们还有五张证没有处理那一点点稿来。执行。第三个先生成实际函数。OK,那么函数这里面就会有这个啊,生成随级数的啊四个函数,然后接下来要做这个存储过程,存储过程。打住。电视了。它这里面是方法啊,啊存储过程刷新。看这么多,那最终的落地呢,是用这个一内啊,我们去调用它动态的去输入参数啊,让它生成对应的数据啊,根据我的要求进行生成,那就是像这五张表里面插入数据啊,啊,那我们回头来啊,看一下我们这个笔记,这个笔记里面我记录了这个详细的这个过程啊,包括建表导入数据啊,这都有,好,那最后这块就是生成业务数据,生成业务数据这个一月内呢,对应的五个参数,第一个参数就是你要生成数据的日期是哪一天啊,第一个日期,第二个呢是订单的个数,甚至多少个,比如说1000个,之后呢是用户的个数,比如说多少个用户,比如说500个,然后呢多少个商品,比如说300个,然后是否删除原来已有的数据,是保存原来的还是我重新开始啊,那这个主要涉及到一个订单。
09:56
ID这个ID号是否是从零往后排,还是说从上次100就是往往后增增加啊这么一个过程,好,那现在我们要求生成2019年2月10号的数据,订单个数1000个,用户200个,商品HQ300个,删除原始数据。
10:19
啊,这么一个需求,那么对应的这个配置信息就在这。2019年2月10号,1000个订单,200个用户,300个SD商品,然后删除密码数据啊,当然第一次你删不删他都目前都没有好,那我们来生产一下。把它拿到这里面。选中执行。正在执行。好,执行完成了,我们来看一下,看里面有没有数据。啊,有数据吧,然后另外呢也有了啊s do有右边一份也有啊,订单详情也都有数据了啊,这就是根据我们的需求去生成对应的这个数据啊,非常灵活啊啊那当然了,你可以去查询一下对应的这个结果啊,两种方式都可以啊都可以。
我来说两句