00:00
行,那我们来看一下这个所谓的叫多表连接啊,多表连接就是三张表就是两张表以上对吧,那无非就是再加一个照应测算呗,对吧,然后再连一张表啊,没有什么难的啊嗯,那这个呢,我们先准备一个数据,我给他拿过来,还是在这VM一个叫LC的一个什么。填ST,然后呢,给它写进来啊,这就是170018001900对应的那个城市信息对吧?啊,就部门表当中,我们当时不是查了部门表吗?最后会有这个信息嘛,位置信息对吧?啊所以呢有一个这个表,然后呢,我把这个表去建立一下啊,那这个呢,就是LC LC name叫location这张表,然后呢也是按杠分割。加秒一件,然后呢,我们加载数据漏A叫logo,呃,大家像这种东西啊,最好不要从文档当中真上就这个漏命令,因为可能跟你放的路径不一样嘛,对吧,很有可能不一样,那你直接粘过来,那肯定不行啊,嗯,然后我们刚才叫LC点对吧,Into table,然后呢,这个叫location这张表。
01:18
新from这个location这张表好数据呢导进来了,那接下来的需求我们就要什么东西呢?啊三表去连接的对吧,我们要查询一下。所有员工存在的部门就是他员工姓名、部门名称以及。部门所在的。城市城市名称来我们的需求啊,叫查询员工姓名,哎,姓名这然后要什么部门名称,以及部门所在城市什么名称啊,所在城市名称,那员工姓名是不是来自于ERP表,部门名称是不是来自于第一批地表,而部门所在城市名称是不是来自于location表啊,所以说这个毋庸置疑就要三张表去做转移啊,当然这个比较简单对吧?C2个呢,那我们把这个东西先写一下员工姓名那一表1.1name,因为我们相对来说到现在为止这几张表里边的,我们现在查的这几个字段应该比较清楚了吧。
02:45
对吧,然后D表里边的第一那啊C表是吧,那这样我们为了方便不会抄错呢,我们把这个东西给他干什么。是不是接表语句放到这个位置对吧?啊,这样就不会弄错了,是不是啊,然后接下来我们坐下来了,到这来,呃,最后呢,要一个location的一个名字叫L表,我们取别名叫L啊,叫location的一个什么name对吧?啊,这样字段我一定不会抄错,因为有提示嘛,走这个EP这张表我们取名。
03:22
E状意上de pd这张表啊,取名叫D表,然后它的一个状移条件啊,那就是写的太多了对吧,DEP number等于d.de p number继续是不是还有一个城市所在名称还没拿到呀,然后继续赵继续找对吧啊赵张表了表了吧,然后啊,对取别名叫啊d.LC的一个什么。d.C等于l.C。
04:02
对吧,啊,就做这个事啊,而且呢,这个是不是三张表都有的信息才能查得到,因为我们都是用的什么内链接嘛,对吧,那至于你想要诶,要不要独有员工信息,你可以考虑用level和其他的东西,对吧,这个呢,我们就用他所有的大家公公共的部分啊,就是说大家都有的啊。你再往后面加表都可以对吧,都可以。你看啊,他这个三个表在一块做连接,最后呢,居然只有一个任务,只有一个MR任务,而且呢,还告诉我们是没有reduce。说明了什么问题,对他用的是他优化了,用的是map,就是MR当中不写过跟吗?写过吧?啊那是不是相当于对优化呀,对吧,是不是把那个小表加载到内存呢,对吧,一样的,它内部自己做的一个优化了,诶需要维丢,而这个效率肯定高。
05:24
对吧?啊,这个是呃,Have,你这个表顺序随便写啊,它都是这样的,因为have现在呃到三版本呢,已经给我们自动做了优化了,无论你把小表写在左边还是大表写在左边都无所谓,都一样了,它都作为优化了啊行,这是我们对应那个信息也只有14个数据,对吧?啊,那个第15个那个部门信息它没有了,对吧?啊,所以它就不会出现,因为我们用的是内连接啊,用的内接的这是多表作用啊,而且呢,只有一个MR任务啊,在这边呢,也有一些说明啊,说明只生成一个,没有照应。六兆啊,因为他用的是map啊,用的map。
我来说两句