前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Spark 源码(9)- Worker 启动 Executor 源码阅读

Spark 源码(9)- Worker 启动 Executor 源码阅读

作者头像
kk大数据
发布2021-11-16 17:08:10
5430
发布2021-11-16 17:08:10
举报
文章被收录于专栏:kk大数据

一、Worker 处理 LaunchExecutor 消息

上一次阅读到 Master 调用 schedule() 方法,遍历 waitingApps,为每个程序决定启动多少 Executor,为每个 Executor 分配多少资源,有了这些信息之后,给 Worker 发送了一个 LaunchExecutor 消息,Worker 开始处理。

Worker 内部先判断发送消息的这个 Master 是否是 Active,如果不是就不做任何处理

然后为这个 Executor 创建本地工作文件夹,当任务执行完成后,会自动清理这个文件夹:

然后 Worker 内部创建了一个 ExecutorRunner ,把启动 Executor 这件事交给它来处理

点进去 start() 方法可以看到启动了一个线程来启动 Executor:

主要逻辑在 fetchAndRunExecutor() 方法中,这个方法中,创建了一个 ProcessBuilder,封装了一个 shell 命令,这个 shell 命令大致是:

代码语言:javascript
复制
java CoarseGrainedExecutorBackend

启动之后,给 worker 发送了一个 ExecutorStateChanged 消息

并且一直等待 Executor 退出,如果 Executor 退出后,会继续给 Worker 发送 ExecutorStateChanged 消息

二、CoarseGrainedExecutorBackend 的启动

CoarseGrainedExecutorBackend 指粗粒度的 Executor 的后台进程,在服务器上的进程名字就是这个,而不是 Executor。

它是一个后台服务进程,负责和 Driver、Worker 通信、启停 Executor、提交 Task。

而 Executor 做的事情就比较单纯,执行、停止 Task,返回 Task 执行结果,其他的和通信有关系的事情就交给了 Backend 来做。

也是职责分工明确的体现。

从 main 方法开始,定义了一个函数,返回值为 CoarseGrainedExecutorBackend,目的是创建一个 CoarseGrainedExecutorBackend 对象出来。

run 方法中,向 Driver 发送了一个消息,来获取 spark 的配置

然后用这个配置为 Executor 创建了SparkEnv,并且启动了 CoarseGrainedExecutorBackend

下面看下 CoarseGrainedExecutorBackend 的 onStart() 方法,给 Driver 发送了 消息,如果 Driver 的响应为 Success,则给自己发送一个 消息:

然后看 Driver 是如何处理这个消息的,来到 CoarseGrainedSchedulerBackend 这个类,搜索 case RegisterExecutor。

封装了一下 Executor 的信息,把这个信息放到自己的内存中来,就完成了处理,然后给CoarseGrainedExecutorBackend 回复一个 true 的信息

CoarseGrainedExecutorBackend 收到 true 的消息后,给自己发送了一个 RegisterExecutor 消息,看下处理:new 了一个 Executor 对象,然后给 Driver 发送一个 LaunchedExecutor 消息,表示注册 Executor 成功。

看下 Executor 的构造方法,构造方法就是大括号中所有可执行的代码,比较重要的是两段,一个是 初始化了一个提交任务的线程池:

一个是初始化了心跳发送器,每隔一段时间给 Driver 发送心跳消息。

三、Executor 启动后,通知各个组件

来到 ExecutorRunner 类中,Executor 启动了之后,给 Worker 发送了 消息

看下 Worker 的处理,Worker 把这个消息发送给 Master

Master 的处理:

把这个消息也同时发送给 Driver :

然后如果有 Executor 注册上来,同时执行一下 schedule() 方法,把等待启动的 Driver 和 App 都启动和调度起来。看下 Driver 的处理(在 StandaloneAppClient 类中):

四、Driver 开始提交 Task

这样的话,Executor 启动流程就完了。然后 Driver 中有一个定时任务,定时把待提交的任务提交上来执行。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2021-11-05,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 KK架构 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、Worker 处理 LaunchExecutor 消息
  • 二、CoarseGrainedExecutorBackend 的启动
  • 三、Executor 启动后,通知各个组件
  • 四、Driver 开始提交 Task
相关产品与服务
云服务器
云服务器(Cloud Virtual Machine,CVM)提供安全可靠的弹性计算服务。 您可以实时扩展或缩减计算资源,适应变化的业务需求,并只需按实际使用的资源计费。使用 CVM 可以极大降低您的软硬件采购成本,简化 IT 运维工作。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档