00:00
今天我们向大家介绍ETL engine ma原数据的使用技巧。我们的前置条件读取Excel文件。写数据表。我们事先准备好的Excel文件有四个字段。分别是ID名称、身高、日期。数据表当中。有五个字段。我们先演示,将前四个字段填充进来。Test xlsx文件当中有一条记录,其中身高没有,另一条记录中日期没有。我们打开已经配置好的ETL任务。有两个串行的任务流,第一个任务流是删除t test的一数据表里的数据。
01:03
第二个任务流是读取Excel文件。BC的四个列。再写到t tests的一数据表。看一下我们的原数据。原数据当中定义了C1到C44个字段。分别对应T的一数据表中的四个字段。第一个需求演示。Default默认值。设置为false。定位default配置默认值。系统读取到空值时,将使用default配置的值来填充。这里的身高和日期。我们分别配置两个默认值。
02:02
C30身高我们默认值配置是零,这里注意nall要配置成false。C40日期我们设置成。四个零。这样读取的效果就是身高空的用零来填充,日期空的用四个零来填充。我们确定。保存一下。执行看一下效果。身高空的已经用零来填充。日期空的已经用四个零填充。证明我们的default。默认值已经起作用了。Air default的作用是?当数据类型转换出错时。可以使用air default来填充默认值。
03:05
我们看一下上面这个例子。默认我们是用零来填充的身高。那如果只转换出错。我们可以用l default,比如负一来填充。这种情况,前提条件是类型转换出错。这里我们模拟设置一个。不是数字的字符。当它再转换成。数字时会报错。之后用我们的负一来填充。这就是air default的作用。我们运行看一下效果。看一下后台数据。
04:00
没错。设置了default,它默认会用字符填充。但是转换成数据类型的时候出错了。就用了我们的负一来填充。Data LAN可对浮点类型输出时。配置保留的小数点位数。我们看一下。数据库当中默认。是两个小数。我们的数据。读取出来的小数格式也是两位。如果这里我设成一位的话,那么像158.99会变成158.90。把最后的九节去掉。181.08会变成181.00,把最后的八节去掉。
05:04
我们看一下效果。设置我们的小数位。是一位。保存。看一下效果。没错。跟我们的预期是一样的。Data format。可以对日期格式的内容输出时。指定格式。我们这里配置成只取年月日。的日期,实际上数据是由年、月、日、小时、分、钟、秒组成。修改一下日期。
06:01
Data format内容。EDD这里注意。我们在转换日期格式的时候。这个位置就不能用四个零了,因为它不是一个有效的日期格式。我们可以使用系统提供的。内置变量MDDHHMM来获取当前系统日期。这样取出来的值就是当前的系统时间。我们保存。看一下输出的值。原来的数据是年月日十分秒。我们刷新一下。时间已经按照我们的格式输出年月日。最后一个数据是空,输出的是当前系统的年月日。
07:07
我们再看一下,通过default可以动态增加一个字段,我们可以增加一个主键。增加主键可以用内置的系统变量32成。我们把数据表当中。C当作主键。改一下我们的配置。我们从Excel文件中多读取一个C5列,与Excel中的正常对应是没有数据的。那么我实际读出来的是一个空列。原数据中我们增加一个C5列。
08:10
Default通过系统变量的32填充。Nab配置成这样,就多增加了一个字段。注意,Nall配置成false。默认值加配置系统变量三二。写数据表,我们也增加一个字段。SQL语句。添加一个C5。
09:09
OKC5已经用U填充。
我来说两句