00:00
呃,那接下来我们看一下这个数据的一个导出,其实导出这一块内容啊,呃,整体来说都不是那么重要了啊,就是说第五章里边呢,最重要的就是这两个啊,重点内容就在于它,你要优先肯定掌握它们俩word跟音色的导入啊,那导出呢,其实我们有很多办法把它这个数据导出,因为数据呢已经在这儿了,现在没讲,现在我们还没讲数据导出,那首先起码你得知道一个我如何把这个东西导到本地。生意咋那么好?这是have里面表的数据吧,这里边STUDENT2里边可能放在那个什么游泳啊,班长啊对吧,然后我要导到本地,可以这么导,对用哈命令是被导,我把这个文件给它下载到本地不就好了,对吧?所以说导出它不是那么重要啊,但是它还有其他的方式来导,我们来看一下啊呃,那么第一个呢,用的也是音色的这个关键词。
01:09
易色的,有同学说跟能不叫插入吗?对吧,怎么到这来又又是导出了呢?来看一下这个语法来叫银色的。然后给一个什么,然后三角from student啊,所谓的那也就说色是插入,但是他往哪插入啊,往本地的一个目录里边去插入。对吧,啊,往本地的目录里面去查,诶用这种方式也可以啊,当然这个其实就跟那个下载是没什么差别了,那我们来看一下啊,这个地方啊,还记得我们当时这张表,我看一下现在。From这个我就用student的表白,呃,这张表呢,应该理来说是按杠T分割的,还记得吧,对吧?好,那我们把这个导出来啊,呃,那刚才语法是音色的over right,然后是先用localo,就是用本地,如果不加localo也可以写一个路径,那他的路径就是啊,这DFS啊,其实就是这这个区别啊,好,Log,然后呢是对吧?好,然后呢,我们给一个路径啊来到这来,我们还用绝对路径的方式,在这个目录底下,我们再来一个什么路径,呃,假如说我make DR一个student的这个路径,呃,这是一个路径了啊,对吧?啊,因为刚才他要的是一个什么。
02:55
一个路径对吧,所以呢,我们把这个拿过来。
03:00
我放,然后接下来再加一个什么student。对,然后之后呢,就的新from这个student表妹。好,这个就导出去了,对吧,然后我们去看一下啊呃,CD到这个student里面好导出来了,对吧,看一下这个东西。它有一个隐藏文件CRC,这是一个校验文件,对吧,MR最后的一个校验文件啊,我们看这个。它是把整个倒下来的,但这里面有奇怪的,它用的就是默认的是吧。
04:00
分隔符,还记得之前我们在这是不是能看到什么,So,对吧,所以说这个不可用。就很不爽对吧,那我们可以做一个事情啊,那明显这个以后你能用吗?用不了也搞不清楚他这个东西到底是什么玩意儿,对吧?啊是一个乱码类的东西啊,所以呢,我们还可以这样去等待。在这我还是因为overright对吧,我还是用这个路径啊,然后接下来加一个什么呢?Form,然后还是一样的,把这个再写一遍,然后BY,然后呢,我们用动画风格是不是看的更明显一点。对吧,好,然后接下来我们再写一个什么,Select the scene from student,走一下。这看着有点乱是吧,但是没关系,等会我们把那个按压上再摁出来,因为这个是table提示啊,Table提示所以说看着好像有很多,我是再按table键,整个的语句呢,等会我们能看到完整一点啊,这个就看的比较乱对吧,不知道它里面写的什么东西啊。
05:12
好,我们先去看一下这个导入数据的一个正常的一个内容,其实就是这个语句,然后再加上什么form,再加上这个select,其实它这个完整的语句应该这样做的。这没问题吧,因为刚才我们直接是用了提示啊,呃,真实语句呢,它应该是这个,好,那我们再去看一下这个目录当中的数据啊,C到交里面来,还是看了一下这个零。对吧,就导出的时候,那现在呢,也同样的用的是form的,跟我们建表的时候是不是完全一样,没有什么区别啊,对吧,它这个地方呢,就给我们导出的时候,最后你生成那个文件用什么。多个字段之间用逗号分割,指的是这个意思啊,指的这个意思啊,行,这是我们所聊的A用格式化的方式对吧?逗号我们看更明显一点,所以如果说用这种方式导出的时候,你就不要用之前不写什么。
06:14
这句话如果不写那个文件,就算你导出来了也怎么样用不了对吧?啊,中间的分割符就很奇怪啊,这个地方呢,用逗画分割啊,去隔开一下啊,这个东西我看一下,我就给它看更多,好重新进一下,呃,这个地方我们用的加了local这个关键字对吧?当然也可以不用local关键字。两个对比其实就少了什么logo对吧?啊,如果不用logo的话,它其实就是让数据导到这个路径,就是HDFS路径啊,导到HDFS路径。行,那我们再写一个,就是还是一样的,我们再把这个地方过一遍啊,银色的。
07:01
Over,然后是不要local了,对吧?啊,刚才是用local用的本地不要local了,直接加什么directly啊,这个时候你写的路径呢,就是还路径的,那我们就放在根目录底下看一下啊嗯,到这来。然后这里边儿我们再来一个student呗,刚才student是我们手动创建好的,对不对。对吧,这个student在ID上有吗?没有吧,我们看一下这个路径不存在,按道理来说,刚才我们看到这个语句,它是会走呀,走既然你是走MR这个路径是其实是可以是吧,走按照按照正常来说是不是可以不存在呀,对吧?好那色的这个语句啊啊,然后接下来呢,我们还是把这个给他分上。然后再继续like什么行,From student对吧,我把这个做一下。
08:04
这个跟刚才的语句相比,就少了一个什么logo,还有一个区别就在于这个C我们并没有提前创建。好,然后我们就看HDFS刷新自己创建的吧,啊这个目录呢,它可以自己创建,然后到这来啊,或者说我们预览一下对吧。还是这个数据没有问题吧,啊,它是导到HDFS啊,其实如果真要导到HDFS,我们也不会这样导,我们就直接CP过来就好了。把那个路径里面东西全部CP过来,是不是可可以的,对吧?啊,这是这种方式,所以说我们就今天就提到这种方式,其实呢,都不太常用啊,因为有更简单的方式,你这个还要走MR是不是更慢呀,如果我CP或者说MV是不是更快呀,对吧?啊,就不会用这种方式了,像这是第一个用A4的方式导出数据啊。
我来说两句