开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark Scheduler在K8s环境下是如何工作的？

Spark Scheduler在K8s环境下的工作方式如下：

Spark Scheduler是Apache Spark中的一个组件，用于在集群上调度和管理Spark应用程序的任务。在Kubernetes（K8s）环境下，Spark Scheduler与Kubernetes调度器（Kubernetes Scheduler）进行交互，以实现任务的调度和资源管理。

具体工作流程如下：

提交Spark应用程序：用户通过Spark提交器将Spark应用程序提交到Kubernetes集群中。
创建Spark Driver Pod：Kubernetes根据用户提交的应用程序规格创建一个Spark Driver Pod。Spark Driver是Spark应用程序的主进程，负责与Spark集群进行通信和协调。
分配资源：Kubernetes调度器为Spark Driver Pod分配资源，包括CPU、内存和其他所需的资源。
启动Spark Driver：Kubernetes启动Spark Driver Pod，并运行Spark Driver进程。
Spark Driver与Scheduler通信：Spark Driver与Spark Scheduler进行通信，向其发送任务请求和资源需求。
调度任务：Spark Scheduler根据可用资源和任务需求，将任务分配给可用的Executor Pod。Executor Pod是运行Spark任务的工作单元。
创建Executor Pod：Kubernetes根据Spark Scheduler的任务分配，创建相应数量的Executor Pod，并为其分配资源。
运行任务：Executor Pod启动后，运行Spark任务的Executor进程。Executor进程接收Spark任务的任务描述，并在分配的资源上执行任务。
监控和管理：Spark Scheduler和Kubernetes调度器持续监控任务的执行情况和资源使用情况。如果有Executor Pod失败或资源不足，Spark Scheduler会重新调度任务或请求更多资源。

总结： Spark Scheduler在K8s环境下通过与Kubernetes调度器的交互，实现了Spark应用程序的任务调度和资源管理。它负责将任务分配给可用的Executor Pod，并监控任务的执行情况。通过与Kubernetes的集成，Spark Scheduler能够充分利用Kubernetes的弹性和资源管理能力，提高Spark应用程序的性能和可靠性。

腾讯云相关产品推荐：

腾讯云容器服务（Tencent Kubernetes Engine，TKE）：提供了托管的Kubernetes集群，可用于部署和管理Spark应用程序。详情请参考：https://cloud.tencent.com/product/tke
腾讯云弹性MapReduce（EMR）：提供了基于Spark的大数据处理服务，可在云端快速搭建和管理Spark集群。详情请参考：https://cloud.tencent.com/product/emr

相关搜索:document.getSelection在reactjs环境下是如何工作的？reduceByKeyAndWindow在Spark streaming中是如何工作的？Spark中的复制是如何工作的？环境配置替换是如何工作的 $age to age列在spark sql中是如何工作的 app engine灵活环境是如何工作的？allocateIds()在云数据存储模式下是如何工作的？java:在BigInteger的情况下for循环是如何工作的 Google Dialogflow环境和版本特性是如何工作的？在dotnet核心中环境变量配置是如何工作的？你能给我解释一下环境变量是如何工作的吗？Firebase原子增量在竞争条件下是如何工作的？在没有任何匹配的情况下，连接是如何工作的在没有完成的情况下beforeEach在jasmine中是如何工作的 forEach在这种情况下是如何工作的？as在ocaml中是如何工作的？分号在"for"开头是如何工作的？在不传递参数的情况下，数组映射是如何工作的？如何在Kubernetes环境下实现spark-cassandra连接器的"repartitionByCassandraReplica“？如何评估DPDK在复杂环境下的性能

相关搜索:

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

YuniKorn：一个通用的资源调度程序

本文翻译自https://blog.cloudera.com/blog/2019/07/yunikorn-a-universal-resource-scheduler/

02

分布式计算引擎 Flink/Spark on k8s 的实现对比以及实践

以 Flink 和 Spark 为代表的分布式流批计算框架的下层资源管理平台逐渐从 Hadoop 生态的 YARN 转向 Kubernetes 生态的 k8s 原生 scheduler 以及周边资源调度器，比如 Volcano 和 Yunikorn 等。这篇文章简单比较一下两种计算框架在 Native Kubernetes 的支持和实现上的异同，以及对于应用到生产环境我们还需要做些什么。

05

Spark Kubernetes 的源码分析系列 - scheduler

这一块代码可以理解为 Spark 是如何实现一个基于 K8S 的调度器，来调度生成 Executor Pod 的。

03

0770-Apache YuniKorn (Incubating) 0.8发布

Apache YuniKorn（Incubating）是一个独立的资源调度程序，旨在将针对大数据工作负载的高级调度功能引入容器化平台。具体可以参考前面的文章《YuniKorn：一个通用的资源调度程序》。

01

Hadoop现在怎么样了？

之前我们提到大数据的时候就会提到Hadoop，Hadoop是大数据的基础框架，是大数据技术的代表。提到HDFS、MapReduce、Yarn，提到HBase、Hive、TEZ等Hadoop生态圈中的一个又一个开源组件。但是最近好像有点不一样了。

05

Spark源码分析-Spark-on-K8S任务调度

由于stage的划分和调度是spark作业逻辑层面上的事，不涉及到物理集群资源，我们不需要关心。

04

Spark Kubernetes 的源码分析系列 - submit

Kubernetes 是作为新的 resouceManager 集成到 Spark 中的，集成的思路跟将 YARN 集成是类似的，Spark 本身提供 Standalone 这种资源管理的模式，当然是不够的。

02

Spark on Kubernetes：Apache YuniKorn如何提供帮助

Apache Spark在一个平台上统一了批处理、实时处理、流分析、机器学习和交互式查询。尽管Apache Spark提供了许多功能来支持各种用例，但它为集群管理员带来了额外的复杂性和较高的维护成本。让我们看一下底层资源协调器的一些高级要求，以使Spark成为一个平台：

02

传统大数据平台如何进行云原生化改造

作者 | 宋文欣以 Hadoop 为中心的大数据生态系统从 2006 年开源以来，一直是大部分公司构建大数据平台的选择，但这种传统选择随着人们的深入使用，出现的问题也越来越多，比如：数据开发迭代速度不够快、集群资源利用效率过低、新的开发工具集成非常复杂等。这些问题已经成为困扰企业数字化转型加速迭代和升级的主要障碍。而传统大数据平台通常是以 Hadoop 为中心的大数据生态技术。一个 Hadoop 集群包含 HDFS 分布式文件系统和以 Yarn 为调度系统的 MapReduce 计算框架。围绕 H

05

大数据基础：Spark工作原理及基础概念

导语 | Apache Spark 是专为大规模数据处理而设计的快速通用计算引擎，在数据挖掘和机器学习领域有着广泛的应用，现在也已形成一个高速发展、应用广泛的生态系统。本文将为大家详细介绍 Spark 的核心技术原理，希望与大家一同交流。文章作者：熊峰，腾讯大数据研发工程师。

04

Kubernetes上的高性能计算 (HPC)

机器学习 (ML) 工程在过去几年已演变为一门学科和职业道路。软件工程师构建 Web、移动和嵌入式体验，而 ML 工程师提供模型版本、推理和整个 RAG 应用程序。

01

容器编排引擎Kubernetes 01——一文带你认识K8S

Kubernetes，简称K8s，是用8代替名字中间的8个字符 “ubernete” 而成的缩写。

01

【云原生|K8s系列第1篇】：K8s的基础概念、组件架构及实战安装

首先，K8s并不是一个传统意义上的 PaaS平台即服务的工具，它充分给使用者提供了很多很多选择的空间。

01

[云原生]从架构看懂K8S

从使用上来说以声明式API来降低运维的操作成本。在生态系统建设方面以极高的可扩展性来提升社区活跃度。从这两个方面既可以填充K8s的不足，也极大地简化了运维操作过程。

03

Spark on K8S 在有赞的实践

随着近几年业务快速发展与迭代，大数据的成本也水涨船高，如何优化成本，建设低成本高效率的底层服务成为了有赞数据基础平台2020年的主旋律。本文主要介绍了随着云原生时代的到来，经历7年发展的有赞离线计算平台如何拥抱云原生，通过容器化改造、弹性伸缩、大数据组件的错峰混部，做到业务成倍增长的情况下成本负增长。

01

Spark整合Ray思路漫谈（2）

首先，大家可以理解为k8s已经解决一切了，我们spark,ray都跑在K8s上。但是，如果我们希望一个spark 是实例多进程跑的时候，我们并不希望是像传统的那种方式，所有的节点都跑在K8s上，而是将executor部分放到yarn cluster. 在我们的架构里，spark driver 是一个应用，我们可以启动多个pod从而获得多个spark driver实例，对外提供负载均衡，roll upgrade/restart 等功能。也就是k8s应该是面向应用的。但是复杂的计算，我们依然希望留给Yarn，尤其是还涉及到数据本地性，然计算和存储放到一起(yarn和HDFS通常是在一起的)，避免k8s和HDFS有大量数据交换。

02

【Spark on K8S】Spark里的k8s client

目前在我们的应用下，会有这样的一种特殊的场景。比如说 Driver 创建在 A 集群，但是需要 Driver 将 Executor Pod 创建到 B 集群去。所以我们这里会有两个集群的 master url，分别是集群 A 和集群 B。那么创建任务的模式就是 spark-subtit 的 master url 指向集群 A，然后给 Driver 的 k8s client 设置其创建 Executor Pod 的 master url 指向 B，那么在现有 Spark 的参数下，能否直接通过 SparkConf 或者环境变量来实现这一点呢？我们看看源码。对于这样的需求，我们首先需要去了解 Spark 是如何跟 k8s 集群打交道的。Spark on K8S 在 submit 的时候默认是直接在 K8S Master 节点提交，通过 --master 或者 SparkConf 中的 spark.master 来指定。

02

Apache Submarine

Hadoop Submarine这个项目是很少被人知道的，因为想去了解他的这个群体本身就非常的小。但是它其实在尝试解决一个很关键的问题，就是如何更高效的让分布式的DL负载跑在不同的资源框架下。

02

「走进k8s」Kubernetes基本概念和组件（13）

k8s为每个pod分配了唯一的IP地址，一个pod里的多个容器共享pod IP。 pod其实有两种类型：普通的pod和静态pod，后者比较特殊，它并不存放在etcd存储中，而是存放在某个具体的Node上的一个具体文件中，并且只在此Node上启动运行。而普通的pod一旦被创建，就会被放入etcd中存储。随后被master调度到某个具体的Node上并进行绑定，随后该pod被对应的Node上的kubelet进程实例化成一组相关的docker容器并启动起来。每个pod都可以对其使用的服务器上的计算资源设置限额，当前可以设置限额的源有CPU和memory两种。其中CPU的资源单位为CPU的数量。一般而言，一个CPU的配额已经算是相当大的一个资源配额，所以在k8s中，通常以千分之一的CPU配额为最小单位，以m来表示，通常一个容器的CPU配额为100-300m，即占用0.1-0.3个CPU。这个配额是个绝对值，不是占比。在k8s中，一个计算资源进行配额限定需要设定两个参数： requests，资源的最小申请量，系统必须满足要求 limits，资源最大允许使用的量。

01

Kubernetes架构简介

在Docker容器技术中，通过容器，我们可以很方便的将我们的应用程序打成一个镜像，然后无论我们在哪部署应用，只要这个环境支持Docker，那么我们都可以通过Docker将我们的镜像运行起来，而不需要关心环境的问题。这一点真正做到了 "一次打包，到处运行" 的效果。正是因为有了容器技术，我们可以不再理会应用的运行环境依赖问题，这也给微服务架构的实现带来了极大的便利。

02

kubernetes基础概念知多少

kubernetes（简称k8s）是一种用于在一组主机上运行和协同容器化应用程序的管理平台，皆在提供高可用、高扩展性和可预测性的方式来管理容器应用的生命周期。通过k8s，用户可以定义程序运行方式、部署升级策略、动态伸缩容，使得用户以一种更灵活可靠的方式来管理应用程序。

02

011.Kubernetes二进制部署kube-scheduler

本实验部署一个三实例 kube-scheduler 的集群，启动后将通过竞争选举机制产生一个 leader 节点，其它节点为阻塞状态。当 leader 节点不可用时，阻塞的节点将再次进行选举产生新的 leader 节点，从而保证服务的可用性。

01

scheduler-设计与实现

调度器的核心目标是: 将 workload bind 到 resource【workload --bind--> resource】，结合各类信息，将这一目标做到最优。

高可用 kubernetes 集群部署实践

Kubernetes（k8s）凭借着其优良的架构，灵活的扩展能力，丰富的应用编排模型，成为了容器编排领域的事实标准。越来越多的企业拥抱这一趋势，选择 k8s 作为容器化应用的基础设施，逐渐将自己的核心服务迁移到 k8s 之上。

03

k8s架构与组件详解

k8s系统在设计是遵循c-s架构的，也就是我们图中apiserver与其余组件的交互。在生产中通常会有多个Master以实现K8s系统服务高可用。K8s集群至少有一个工作节点，节点上运行 K8s 所管理的容器化应用。

03

一文带你了解K8S 容器编排（下）

初学者容易误以为容器的任务只在于部署行为－－将软件在容器中部署以提供持续的服务。但其实容器也同样大量的被应用于批处理程序的运行上。

01

原生的在K8s上运行Flink

Kubernetes 相信大家都比较熟悉，近两年大家都在讨论云原生的话题，讨论 Kubernetes。那么什么是 Kubernetes 呢？

04

K8S | 核心原理分析

从服务的能力上看，可以进行分层管控，只是其中有相当一部分服务层，改动更新的频率很低，所以感知也不明显；

02

软件测试|K8S 容器编排

初学者容易误以为容器的任务只在于部署行为－－将软件在容器中部署以提供持续的服务。但其实容器也同样大量的被应用于批处理程序的运行上。比如测试行为是典型的批处理任务范畴，它不提供持续稳定的服务，它只是一段特定的程序，而一但这段测试程序结束后就应该销毁一切，包括执行环境和所占用的资源，容器对比于传统的虚拟机的优势也在于除了容器更加的轻量级外，容器的创建和销毁都很方便，通过 K8S 的能力可以很方便的在需要时创建，结束时销毁回收资源以达到更好的资源利用率（就如上篇文章中介绍的 Jenkins 与 K8S 打通后的运作模式）。而现在准备的测试案例会更加特殊，它需要重复运行 N 次，因为本次执行的是稳定性测试（也有人叫它浸泡测试或者长期高压测试），这种测试类型的特殊之处就在于它的目的是验证被测系统在长期的高压下是否仍能够提供稳定的服务。所以它的测试方式是长期的（1 天，1 周甚至更长时间）不间断的运行自动化测试。而自动化测试的数量是有限的，它不可能持续的运行那么长时间，所以才需要重复运行。在不改造测试框架的前提下 K8S 能通过什么样的方式来帮助完成这个测试需求。首先看一段 K8S 提交任务的配置文件。

01

一文带你了解K8S 容器编排（下）

初学者容易误以为容器的任务只在于部署行为－－将软件在容器中部署以提供持续的服务。但其实容器也同样大量的被应用于批处理程序的运行上。比如测试行为是典型的批处理任务范畴，它不提供持续稳定的服务，它只是一段特定的程序，而一但这段测试程序结束后就应该销毁一切，包括执行环境和所占用的资源，容器对比于传统的虚拟机的优势也在于除了容器更加的轻量级外，容器的创建和销毁都很方便，通过 K8S 的能力可以很方便的在需要时创建，结束时销毁回收资源以达到更好的资源利用率（就如上篇文章中介绍的 Jenkins 与 K8S 打通后的运作模式）。而现在准备的测试案例会更加特殊，它需要重复运行 N 次，因为本次执行的是稳定性测试（也有人叫它浸泡测试或者长期高压测试），这种测试类型的特殊之处就在于它的目的是验证被测系统在长期的高压下是否仍能够提供稳定的服务。所以它的测试方式是长期的（1 天，1 周甚至更长时间）不间断的运行自动化测试。而自动化测试的数量是有限的，它不可能持续的运行那么长时间，所以才需要重复运行。在不改造测试框架的前提下 K8S 能通过什么样的方式来帮助完成这个测试需求。首先看一段 K8S 提交任务的配置文件。

01

学习kubernetes，从快速搭建k8s集群开始

本系列文章，我们将在Ubuntu Server 18.04上搭建k8s环境进行入门学习。为了使用原生的Ubuntu Server 18.04，我们将使用multipass来创建多台Ubuntu Server 18.04虚拟环境。也就是说，如果你想完整参考本系列博客学习，你电脑上应当安装并能正常运行multipass，如果你想了解multipass基本操作，可以参考我写的另一篇博客：【使用Multipass管理Ubuntu虚拟机】。本文演示k8s集群搭建步骤，并不涉及k8s基础知识，你可能对文章的一些专业词语感到默生，但没有关系，我们在后面会循序渐进地介绍k8s知识。

02

k8s组件含义

Master 组件对集群进行全局决策（例如，调度），并检测和响应集群事件（例如，当不满足部署的 replicas 字段时，启动新的 pod）。

02

Kubernetes V1.15 二进制部署集群

以下操作均在/data/ssl_config/etcd/目录中 etcd证书ca配置

03

Kubernetes(k8s)1.14 离线版集群 - 部署master节点

声明：如果您有更好的技术与作者分享，或者商业合作；请访问作者个人网站 http://www.esqabc.com/view/message.html 留言给作者。如果该案例触犯您的专利，请在这里：http://www.esqabc.com/view/message.html 留言给作者说明原由作者一经查实，马上删除。

03

【重识云原生】第六章容器6.2.1节——Kubernetes概述

为了降低虚拟机造成的物理主机资源浪费，提高物理主机的资源利用率，并能够提供像虚拟机一样良好的应用程序隔离运行环境，便诞生了容器技术。容器管理类似于虚拟机管理，主要用于容器的创建、启动、关闭、删除等容器生命周期的管理。常见的容器管理工具有：

05

1. 开始Kubernetes: k8s

本节目标: 要求会画bolg系统和kubernetes系统的架构图, 并且知道架构每一部分的作用.

02

Spark On K8s实战教程

k8s是一个开源的容器集群管理系统，可以实现容器集群的自动化部署、自动扩缩容、维护等功能。

01

k8s必学必会知识梳理

对外暴露了Kubernetes API。它是的 Kubernetes 核心控制层。它被设计为水平扩展，即通过部署更多实例来横向扩展。API Server 负责和 etcd 交互（其他组件不会直接操作 etcd，只有 API Server 这么做），是整个 kubernetes 集群的数据中心，所有的交互都是以 API Server 为核心的。API Server 提供了以下的功能：

03

Spark 系列教程（2）运行模式介绍

Apache Spark 是用于大规模数据处理的统一分析引擎，它提供了 Java、Scala、Python 和 R 语言的高级 API，以及一个支持通用的执行图计算的优化引擎。

03

k8s基础知识_k8s快速入门

（第一章）K8S介绍应用部署方式 K8S简介 K8S组件安装举例：安转nginx服务 K8S概念

02

Spark-Submit 和 K8S Operation For Spark

本文翻译自 Lightbend 的一篇文章，文章日期还比较新，2019/02/26。文章分为两部分，翻译也将分为两个部分。附上文章链接如下:

02

【Kubernetes】1

1. container image：一组联合挂载在/var/lib/docker/aufs/mnt 上的 rootfs

02

Docker集群编排工具之Kubernetes（K8s）介绍、安装及使用

K8s基础原理 k8s中文社区：https://www.kubernetes.org.cn/ 简介 Kubernetes与较早的集群管理系统Mesos和YARN相比，对容器尤其是 Docker的支持更加原生，同时提供了更强大的机制实现资源调度，自动管理容器生命周期，负载均衡，高可用等底层功能，使开发者可以专注于开发应用。 Kubernetes是一个开源的，用于管理云平台中多个主机上的容器化的应用，Kubernetes的目标是让部署容器化的应用简单并且高效（powerful）,Kubernetes提供了应用

07

后 Hadoop 时代，字节跳动如何打造云原生计算平台 | 卓越技术团队访谈录

在大数据行业里，2006 年 Hadoop 的诞生，给我们带来了变革意义的改变，大数据生态组件也开始层出不穷。各种不同体型的企业都喜欢选择开源大数据软件来搭建自己的系统，无论是先前十分繁荣的 Hadoop，还是后来涌现出来的 Kafka、Flink 等，都被广泛地使用着。

05

带着问题学 Kubernetes 架构！

打开这篇文章的同学，想必对 docker 都不会陌生。docker 是一种虚拟容器技术，它上手比较简单，只需在宿主机上起一个 docker engine，然后就能愉快的玩耍了，如：拉镜像、起容器、挂载数据、映射端口等等。

03

Kubernetes 笔记 04 架构是个好东西

任何技术的诞生，都会经历从架构设计到开发测试的过程，好的技术，往往也会有一套好的架构。架构是个好东西，它能帮助我们站在高处看清楚事物的整体结构，避免过早地进入细节而迷失方向。

04

Kubernetes 二进制部署（一）单节点部署（Master 与 Node 同一机器）

0. 前言最近受“新冠肺炎”疫情影响，在家等着，入职暂时延后，在家里办公和学习尝试通过源码编译二进制的方式在单一节点（Master 与 Node 部署在同一个机器上）上部署一个 k8s 环境，整理相关步骤和脚本如下参考原文：Kubernetes二进制部署（一）单节点部署 1. 相关概念 1.1 基本架构 📷 1.2 核心组件 1.2.1 Master 1.2.1.1 kube-apiserver 集群的统一入口，各组件协调者以RESTful API提供接口服务所有对象资源的增删改查和监听操作都

02

云原生第3课：Kubernetes 系统快速入门

本篇文章来自《华为云云原生王者之路训练营》黄金系列课程第3课，由华为云容器批量计算首席架构师马达主讲，介绍云原生技术体系中Kubernetes的相关概念和技术架构。

00

云巢揭秘：数据库产品 PaaS On IaaS 实践分享

作者：kevinyfsun(孙勇福) 腾讯CSIG云产品研发工程师导语| 随着2B行业的蓬勃发展，数据库产品中心原有烟囱式发展模式，在资源调度和统一管控上面临的挑战越来越多。同时腾讯云IaaS产品经过十几年的发展，可以提供可靠稳定的服务。当前 Kubernetes 已经成为资源编排的事实标准，TKE 产品形态在腾讯公有云运行多年，基于 TKE 实现数据库领域的 PaaS on IaaS 成为一个可行方案。本文主要分享数据库产品中心基于 TKE 实现 PaaS On IaaS 的实践整体过程，未来会有

02

深入玩转K8S之使用kubeadm安装Kubernetes v1.10以及常见问题解答

Kubernetes是Google开源的容器集群管理系统。它构建于docker技术之上，为容器化的应用提供资源调度、部署运行、服务发现、扩容缩容等整一套功能，本质上可看作是基于容器技术的mini-PaaS平台。

02

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭