00:00
好,那从今天开始呢,咱们就学习这个汉大概是五天的一个时间目录呢,还是跟大家之前学习的一样啊,第一个笔记资料代码对吧,视频这两个里边呢,肯定是没有东西,到时候你自己把代码放里边,我每天的视频呢,会放到这个地方啊,每天的视频放这,那假如今天第一天我就正常的对滴滴是吧。到视频呢,就放这里边,大家自己,因为我整个目录都共享了,大家随时可以去下,然后这个当中呢,笔记我们打开,我们先聊一下,我们整体在汉当中需要学习哪些东西啊,我们先把这个目录呢这列一下啊呃,看起来浩浩荡荡的这个11章对吧?第一章是基本的一个概念。我们需要去了解一下,那这里边呢,其实它会涉及到有两道面试题啊,这里边呃,那两道面试题呢,第一个have的架构,面试的时候呢,他可能会问你,哎,Have的架构是什么样,这个表现说比较简单,第二个呢,就是我们的第四节跟我们数据库去做一个比较,面试当中相对来说这两个题呢,是比较容易问到,就关于看这块,但是它都属于面试题啊,相对说比较简单一点啊,这是第一章的内容当中啊,都一些概念的介绍,大家有两个面试题需要大家去关注一下,呃,第二张呢,是我们的一个安装,安装这一块看的,哎,这么多对吧?哎,九结确实比较麻烦啊,确实比较麻烦,因为主要麻烦的它的一个访问的方式呢比较多。
01:43
啊,所以说大家需要在讲完之后呢,把这块自己去做一个整理,我们需要通过什么样的方式去访问这个汉,那对应的需要启动什么样的一个进程,你需要自己把这个去做一个总结。但安装的东西倒不是说大家要把它背下来或者什么样子的,但你要理解它的防方式的不同,因为这里边我们需要给大家去介绍三种不同的防方式啊,所以说大家要去关注一下,自己是整理一下学完之后,对吧,这第二章安装内容,第三章have的数据类型,那这块呢,倒还好了,因为这跟我们Java当中的类型很类似。
02:19
所以说不是咱们所谓的一个什么重点内容的一个章节了,那既然对于have,大家都知道,刚刚我们提到了啊,它跟数据库要做比较,主要的原因在于它也是写circle啊,但这个circle我们一般称为叫hi hi circle。也也不叫have,叫have q l。叫language对吧?Have专业有的一个查询语句,但是它跟我们所学过的MY思里边内容呢很像,但有一些差别。对吧,那所以说有了很像的一个基础,对于大家来说既是好事又是坏事啊,我不知道大家买思课掌握的怎么样啊,如果说你学汉语的时候,反而你马思克掌握的不是那么好,反而是好事,对吧?因为你学一个新的东西不容易搞混啊,不容易混啊,但是我因为其实对于大家来说,买S讲的东西并不是很多,所以就还好啊,所以就还好,如果说你买S学的很透的话,经常容易被搞混。
03:18
啊,反而不好,你就现在这个状态是蛮好的,有一些思维的基础,知道什么c select from这些东西对吧,但是具体的再深入了解,就是说其他的一些函数可能就不太了解的情况下,那这个是比较好的,说说实话啊,呃,那所以呢,对于一个S的一个框架来说,它最重要的就是查询语句,或者说它的一个操作语句,对吧,那么明显的。456这三张。是U为半电的了啊,那分为DDLDML和查询,其实查询应该是属于什么。D里面的对吧,DDL和D分别是什么意思啊,数据定义在数据定言,数据管理语言,或者叫数据操作语言对吧?那其实DDL呢,就是大家所谓的监库见表的配置,对。
04:12
就是增删改查库和表叫DD对吧,那DML呢,对增删改查数据。啊,增删改查数据,但是在have里边啊。咱们一般不去聊改和删,只聊增和查数据,主要原因还是数据量比较大的,他不去应对这种在线的业务啊,不会接在线业务,如果你在接在线在线业务的话,那么就会需要什么。山和感啊,动态的去更新这个数据,对吧,那我们呢,看是用来做数据分析的。它主要的应用场景呢,就一次写入,多次读取,是这样的一个场景。
05:04
对吧,我只是往里边写一次数据,但是我查可能要根据不同的需求去查很多次,所以在have里边呢,其实我们这三章说的它比较重要,但是最重要的一个,大家觉得哪个对第六章查询,所以我们刚才所聊的查询,其实是DML当中的一种,但是我们给他摘出来了。对,因为第六章呢,是咱们最重要的一章啊,最重要的一就是整个的一个查询这一块啊,就现在我到时候还会去扩展一些东西在里边啊,现在呃,因为是新的要录视频嘛,完了之后呢,去去还要去给大家加一些函数啊,当然第一天我们讲到的说后期有文档更新,我会告诉大家啊,大家去下载更新一下就好了,呃,后面几章啊,七八章啊,第七章呢,是那个分区和分同表啊,就是在have当中一种特殊的表啊,这个讲的什么意思呢?分区这个概念大家应该清楚。
06:04
嗯,对吧,就是教我们数据集给他干什么。分开啊,分开那表存数据的地方。那他把数据分开,其实就是说把数据存储给来了,分开放到不同的目录里面啊,放到不同的目录里边,就这个意思啊,待会我们具体聊它的一个好处,其实这两个东西呢,相当于是一种优化手段,嗯,我不把整张表的数据放在同一个目录下。因为有可能我未来不需要干什么。所有的数据,我只要部分数据,那我就可以避免掉扫描什么全表对吧?啊其实这样一个概念啊,分区和分头都是将数据呢,给它划分开啊,比如做这个事的,然后第八章是所讲的它的一个函数,在汉当中呢,它有很多很多的一个。函数啊,有跟MY相同的,也有跟MYS不同的,当然它跟MY一样,还可以自定义函数,就是有时候它系统提供的函数不能满足我们特殊的一些业务需求的时候。
07:12
对吧,那我们就可以自定义函数啊,我自定义函数就写代码的方式去完成,再去创建一个函数啊,就MYSQ当中呢,也可以做这个事,但是应该是没有给大家去讲的,如何是在MY当中C定义函数对吧,比较少讲,那在have当中呢,我们要去掌握一下啊,那最后。这两个压缩以及优化。对吧,这两张呢,也属于它的一个优化,压缩其力些力优化对吧,就减少中间的什么传输以及最终存储的数据大小。对吧?啊,因为数据量比较大,那我们压缩了之后呢,数据存储就会小一些,减少我们磁盘的占用啊,那中间传输的时候是不是数据量也小一些。对吧?啊,其实有时候中间传输就是说,假如说是MR过程当中啊,嗯,其实有说我们比较少去使用压缩,虽然你IO省出来了,但是你传过去之后,Reduce这边要做什么事,要做解压,对吧?啊,所以一般是在最后的时候我们去做一个压缩啊,最后的时候做一个压缩,存储方面做一个压缩啊要多一些对吧,这条优那优化这一章啊,也是大家讲的一个重点内容。
08:25
啊,所以说整个文档当中最后一章呢,是实战对吧,还有实战就是说有一个小案例需要大家去写,所有课去完成,但是我们会带着他去写啊,啊那其实整个的11章内容最重要的给大家展出来。第六章和第十章这两章是最为重要的一个,第十章内容呢,以面试为主,他会问你优化,当然他可能不简单的去问你,诶,你对于汉做过哪些优化?他可能问的问题一般是这样的,他说你在使用have过程当中,或者说你在写这个开的过程当中遇到过什么问题?
09:03
你是怎么解决的?其实这个问题就是在问什么?优化啊优化就解决问题嘛,把一个不能跑的任给他调调调,最后能跑了,把一个直接跑一个小时的务给他一调,跑什么30分钟20分钟,这个都属于什么优化,对吧?你遇到什么问题,那问题就是说,诶这个骇口跑不了,因为什么原因对吧?或者说这骇跑的特别慢,又是因为什么原因,最后呢,我做了什么事情把它解决了,那这就是咱们所说的优化当中的。啊,那其中有一些呢,就是说你需要发现问题去做的事情,当然有的优化呢,就是你在写搜的时候就要去避免的,就类似于买当中大家肯定会强调一个点,尽量的少用C加锌,这个事肯定说过。没提过,后来就尽量的不要用C来的心,对吧?啊,就是说你要什么列你就选什么列就好了啊,不要用材料芯,因为它的一个效率怎么样,相对来说比较低一些,对吧,类似于这样的东西啊就比较多,那这种东西呢,不是说你遇到问题之后再想办法去解决所考虑的问题,而是你在写色的时候干什么。
10:16
就应该要去考虑的问题对吧?啊是这个意思啊,像这是我们整个课程的一个介绍,所以说大家要知道一下我们所讲课过程当中的一个重点内容在哪啊,其实它这个查询也是比较难的啊,就have这块有很多的一些比较特殊的函数啊,呃,不爽函数倒还好,其实如果说你在学单个函数的时候都还好,但是真的一个需求摆在你面前的时候,你也觉得有点困困难了啊,到时候呢,首先在文档当中啊会有这个。课后练习。啊,课后练习大家呢可以去,嗯,学到哪块之后可以做哪个题,我可以给大家去说一下,起码等我们第六章查询这块学完之后,你再动手做这个题,因为他会用到我们在第六章所用所涉及到的一些函数啊,如果提前做的话,可能会比较困难用,当然用have那种方式会用之前大家所学习的买so这种方式也能解决的了这个问题,但是呢,要麻烦麻烦很多。
11:16
啊,你在学完第六章之后呢,可以尝试做一做,但是呢,还是对大家说比较困难啊,同时除了这几个题之外啊,嗯,我手上还有一些还有个题也可以到时候发给大家,大家去提前的去做一做,然后呢,我们抽个时间可以给大家去讲一讲啊,包括早上分享的时候,那大家做完了,有谁做完了,对吧,你上来讲一讲都可以啊,对吧,给大家去共享一下啊,如果我看一下你的思路啊,再给大家整体去串讲一下,如果有什么问题,如果说没有问题呢,我就不讲了,如果有一些问题的话,那我再去给大家去讲一讲啊,首先的一些题,因为我之前说了,我可能比较喜欢写测考,所以我之前带过的班都跟学生说,只要我有时间,只要你在上课,你在面试过程当中遇到一些什么思题,发给我就行了,我有时间都会给你做。
我来说两句