温馨提示:文本由机器自动转译,部分词句存在误差,以视频为准
00:00
接下来我们看一下这个本地模式啊,这个东西呢,在生产环境当中,我们可以给它打开,就是大家知道在我们运行MR任务的时候啊,它的一个管理引擎,就资源管理引擎可以有哪些啊。有logo还有呢。安嘛,对吧,就雅安还有一个叫classic那个都不常用啊,就基本上我们用的logo,或者说是这个雅安啊,默认的呢,它其实是集群模式啊,默认的它其实是群模式啊,是这样的一个内容,好,那接下来呢,我们看一下啊呃,首先呢,我们走一个,现在呢,我们什么都没改,对吧,我写的。看心from这个EP这张表,他现在走的一个任务叫重。如果本地模式,它的一个任务的名字叫什么?
01:01
叫一定能看到一个关键字叫local啊,Local我们可以看一下执行效率啊。23秒对吧,那此时呢,我们就可以开启这个本地模式啊,当然还有其他的一些属性,就什么时候我们有限制条件的,不是说所有的我只要开启本地模式,我都用本地,那不就完了吗?那我数据量大吗?因为本地模式相当于是一个单机模式,对吧?就在当前节点去运行,所以说它会对于这个数据上有一个什么。一个限制,以及对于文件数量有一个什么,有一个限制,对吧,就是说小于多少个文件,这个文件加在一块小于多少数据量的时候,我们用本地这个也比较合理吧,那数据量太大了,就算你开了本地我们也不能用了,所以这样是动态就管理了,对吧?啊那首先呢,默认就是关闭了刚才我们执行的这个索语句。
02:00
对吧,啊,它是23秒是吧,那接下来呢,我们打开本地模式,默认是关闭啊,默认是false,那我们只要把这个东西等于什么。开启,然后我们执行的缩口一样不变,对吧,走。看刚才我们说了,让大家关注那个名字,刚才是不是没有localo,现在呢用的本地啊,单节点的肯定比雅安要快,因为你要提交到雅安,还要跟雅安通信,雅安呢还要去找节点给你去运行,中间明显多了网络传输,对不对,那这个时候本地我就在102项去运行嘛,啊但是它有缺点,就是说数据量大的时候怎么样啊,跑不了对吧?啊,数据量大的跑不了是这个意思啊,行,这是我们所聊的叫本地模式,它也是属于这种优化,当我们数据量小,文件数少的时候,用本地是不是速度明显的快很多啊,十几倍之差呢,这23对吧,刚才现在呢2.5啊,差了十倍呢啊,这个差距还是蛮大的,他用的是local好度,就本地的啊单机模式相当于。
我来说两句