00:00
讲过了这前面的一些地方,呃,那首先呢,有个查询,它有一个官方文档,还是之前我们那个看到的官方文档,我看下这个时候能不能网速好一点,它网更新了是不是好好一些了,是不是它里面呢,就会有这些,这个是查询的语法对吧?啊里边有这个呢?啊,当然这个是之前没有的啊,Part分区对吧,Have里边是有的,因为它利用MR嘛,分区计算啊,Heavy limit这个东西就有了,对吧?呃,然后其他的这个group by什么。当然这个还有这个应该是没有的,对吧,他当中没有的好对吧,状语,状语当中呢,有这个have状语,还有out状语,就是大家所知道的left out状语跟out状语,但其实out可以不写,包括内连接叫in的状语,这个in的是不是可以省了对吧?啊,就直接写状语就好了啊呃,Union。
01:06
连接这个知道吗?这个也不知道是吧?啊行,那后面的东西就不知道了,因为在MYS当中呢,就没有了啊,这个开窗啊over呀,这些东西没有了,这是我们后面要不同的,那前面呢,我们还是一样的,刚才所说的复习,就是说把这些东西再大家再再去过一遍啊买这个都已经学过了,嗯,你们之前说手上不有那个题吗?做的怎么样了,不是那天还问你们有没有那个题,如果没有的话,到时候把那个老师给他发一下,抽时间去做一做啊,首先写一写,搜个搜个这个东西呢,要多练。真的要多练,没有什么技巧啊,到时候你会看到千里有怪的搜狗啊,那我们看一下整个的查询语法是这样的,C select的语句,对吧?呃,C select新其实然后呢,或者说查询字段,或者说加distinct,加驱虫的方式。
02:05
查这个字段,我们要通过什么去重的方式去查啊,因为可能一个字段,哎,假如说有重名的啊,我们就就想重名的呢,我就要看一个对吧,要distinct就做一个驱重,然后书上一张表后面呢,跟着where To By all the by,当然后面如果说你有heavy,那海位写在哪个位置,海位写在哪啊对,在这个之间嘛,因为既然搜狗这个关键字的位置,你不能随便写是不是啊。对吧,它比较死啊,这个语法是吧?啊后面这个是class by,这个我们后面再聊啊,然后呢,还有个limit limit都知道对吧?啊现在说出多少个啊,假如说你这张查有100条,那我就只看前十条,对吧?啊,可以做这个事情啊啊那我们看基本语法啊,第一个就所谓的基本查询,就select什么东西从一张表里边去查,那我们先造一些数据啊,先造一些数据啊第一个呢,我们准备一个DP表,把这个文件呢拿过来。
03:08
后面的数据啊,我都统一放了,不像刚才之前放测试的那么乱了,对吧,那我们在这专门来一个data目录啊,CD的这个data目录里边,在这Y一个dept.t Di插入啊,注意一定要敲一个I啊,如果不敲I的话,我估计你里边数据啊从从这开始的。对吧,从这个C开始的,知道是为什么吧,如果不敲A,是不是他遇到第一个AIO的时候开始插入了,对吧?啊,所以一定要敲一个I,要注意一下,要不然数据就不对了啊,这里面是杠T分割啊,啊这是部门表啊,有这些部门对吧?啊那么接下来呢,YM一个EP这张表点PG啊把这个文件呢搞一下,还有一个员工表,这两张表大家还熟吗?不熟啊,这不是你们讲买色克那两张表啊,没有那个表达,现在你们自己什么自己编的无所谓了,出去就行了,然把这个表现一下,这个表达已经敲很多了,不敲了,然后直接呢可的table先有一个部门表。
04:35
OK吧,然后呢是三个字段嘛,部门ID,部门名称和一个什么location位置啊,就是说上面呢,是表示的它的一个位置的一个编号,1700可能对应的什么上海啊,1800可能对应的北京是这个意思,就是一个编号,其实也就后面呢,涉及到三张表,连接的时候,我们还会有一张LOC表。啊是这意思行,那这个地方呢,我们拿过来啊,杠地分割对吧,剪一下,然后接下来呢,我们把另外一张表也对一下,我们也同时看一下一个字段啊第一个。
05:11
或者说我把这个一条数据拿过来啊,我拿这个吧,因为里面其实有有文档的字段的啊,拿一条数据过来,我们对比着看一下啊嗯,这个能能看清这个,这个上面能是吧,眼神比较好是吧?行,那我们看一下,第一个是员工编号7499对吧,第二个是员工的姓名对吧,第三个是他的一个工作作为一个什么销售对吧?啊销售,然后。这个是他的一个manager。他的一个啊,对经理就是他的一个上级,领导是他的一个领导,OK吧,啊也是一个编号,这个编号呢,其实你要自连接的话,自己关联自己的时候,它对应的是另外一个人能懂这意思,7698是吧?啊7698这里边有吗?这对吧,他那是作为领导的,所以你看啊,它里边他还有领导对吧?对导啊,那7839 7839这个地方就没有这个字段,发现没?因为他最大的可能是公司的boss对吧?啊就所以说他没有领导,这是领导啊,就相当于manager,然后这个入职时间还有对象吗?对吧?入职时间啊,1981年啊,这个时间是吧,还比较早啊,这个是什么?S看1981年的1600。
06:52
怕有点高是吧,人家可能后面答案知道单位是万呢,又没说是圆是不是对吧,你不能小小看人家,然后这个这个是奖金啊,是奖金绩效奖金,然后最后一个。
07:08
是部门编号,他是哪个部门的,他作为销售应该属于销售部门啊,看三个部门是不是销售部门啊,对吧?啊是这样关联的这个数据啊,当然在员工信息当中,这个我挑的是一个比较全的,明显发现到有的人就没有自己的管理者了,因为他是最高的最高级的,对吧?啊,那有的人呢,其实是没有奖金的,你你比如说这条数据。这条数据这个是不是工资啊,他就没有什么奖金,对吧?啊,没有这个奖金,就这个业绩奖金,因为销售嘛,一般都有业绩奖金的,对吧?啊是这样的一个情况啊,好,这张表呢,我没拿过来,我们就稍微熟悉一下里面字段后面呢,我们用到了字段呢,也不是说全部都用得到啊,这两张表建好加好之后呢,我们把数据加载进来,那加载命令回顾啊,这个我就不粘了,你瞧一下怎么来,你报我写。
08:03
从本地文件加载数据到这个表里边,Load data,本地文件要加local对吧,Local in pass OK,然后是路径,路径的话,这种东西最好不要自己什么,不要自己写,因为你写错了就很尴尬,是不是这种事就类似于大家在配置文件一样,那有的人我记得住,反正我就自己写,最后就出错了啊,结果呢,很尴尬,然后呢是de PT,点什么点C对吧?哎,我们要把这个文件导到DEP列表,然后呢,是不是into table,然后是我们的dept这张表,对吧?走一下,好,下来我们查一下啊,小心from这个de PT张表倒进来了,没有问题吧,那么接下来还有一个我们再写一遍啊,漏的后面可能像这种语句我就写的越来越少了,因为大家今天晚上练习之后,相对来说比较熟悉了之后。
09:04
就不浪费这个时间了啊,漏data还是什么local in pass对吧?啊,路径我还是去拿一下啊,好的,嗯,接下来呢,应该用的是EP,点填C还是一样的into table EP这张表对吧?好c select的新from EP相当于我们数据呢,就准备好了,那其实对于这个而言啊,你可能用那个B带have so的那种方式看着就会。舒服一些,它有格子嘛,对吧?啊,哪个字段没空啊,你都能对应上对吧,这里面是不是有文档的对吧?啊有文档的字段啊,行,这是我们将这个数据先准备好啊。我把这。
我来说两句