开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

Spark-submit executor内存问题

Spark-submit是Apache Spark中用于提交Spark应用程序的命令行工具。executor内存问题是指在Spark应用程序中，executor的内存分配不合理导致性能下降或者任务失败的情况。

在Spark中，executor是运行在集群中的工作进程，负责执行任务和存储数据。executor的内存分为两部分：用于存储RDD数据的堆内存（Heap Memory）和用于存储执行过程中的临时数据和其他元数据的堆外内存（Off-Heap Memory）。

当executor的内存分配不合理时，可能会导致以下问题：

内存溢出（Out of Memory）：如果executor的内存不足以容纳执行过程中的数据，就会发生内存溢出错误，导致任务失败。
垃圾回收（Garbage Collection）开销过大：如果executor的内存分配过小，会导致频繁的垃圾回收操作，降低了任务的执行效率。

为了解决executor内存问题，可以采取以下措施：

调整executor内存分配：可以通过调整Spark应用程序中的--executor-memory参数来增加或减少executor的内存分配。根据应用程序的需求和集群的资源情况，合理分配executor的内存大小。
调整堆内存和堆外内存的比例：可以通过调整Spark应用程序中的--spark.executor.memory参数来调整堆内存和堆外内存的比例。根据应用程序的数据量和计算需求，合理分配堆内存和堆外内存的大小。
使用内存管理器：Spark提供了不同的内存管理器，如默认的堆内存管理器（Heap Memory Manager）和Tungsten内存管理器（Tungsten Memory Manager）。可以根据应用程序的需求选择合适的内存管理器，以提高内存利用率和性能。
数据压缩：如果应用程序处理的数据量较大，可以考虑使用数据压缩技术来减少内存占用。Spark提供了多种数据压缩格式，如Snappy、Gzip等。
数据持久化：对于需要多次使用的RDD数据，可以将其持久化到内存或磁盘中，以减少内存占用和提高性能。

对于executor内存问题，腾讯云提供了一系列的云计算产品和解决方案，如腾讯云Spark集群、腾讯云容器服务、腾讯云函数计算等。这些产品和解决方案可以帮助用户快速搭建和管理Spark集群，提供灵活的资源配置和内存管理功能，以解决executor内存问题。

更多关于腾讯云Spark集群的信息，请参考：腾讯云Spark集群

更多关于腾讯云容器服务的信息，请参考：腾讯云容器服务

更多关于腾讯云函数计算的信息，请参考：腾讯云函数计算

页面内容是否对你有帮助？

有帮助

没帮助

相关·内容

Python大数据之PySpark(四)SparkBase&Core

在哪个文件下面更改？spark-env.sh中增加YARN_CONF_DIR的配置目录

04

【Spark篇】---Spark中资源和任务调度源码分析与资源配置参数应用

Spark中资源调度是一个非常核心的模块，尤其对于我们提交参数来说，需要具体到某些配置，所以提交配置的参数于源码一一对应，掌握此节对于Spark在任务执行过程中的资源分配会更上一层楼。由于源码部分太多本节只抽取关键部分和结论阐述，更多的偏于应用。

03

spark-submit介绍

spark-submit脚本通常位于/usr/local/spark/bin目录下，可以用which spark-submit来查看它所在的位置，spark-submit用来启动集群中的应用，它使用统一的提交接口支持各种类型的集群服务器。为了将应用发布到集群中，通常会将应用打成.jar包，在运行spark-submit时将jar包当做参数提交。

01

Spark命令详解

之前我们使用提交任务都是使用spark-shell提交，spark-shell是Spark自带的交互式Shell程序，方便用户进行交互式编程，用户可以在该命令行下可以用scala编写spark程序，适合学习测试时使用！

04

工作常用之Spark调优[二】资源调优

先设定单个 Executor 核数，根据 Yarn 配置得出每个节点最多的 Executor 数量，每个节

02

工作常用之Spark调优【二】资源调优

先设定单个 Executor 核数，根据 Yarn 配置得出每个节点最多的 Executor 数量，每个节

02

[1015]spark-submit提交任务及参数说明

spark-submit 可以提交任务到 spark 集群执行，也可以提交到 hadoop 的 yarn 集群执行。

02

Pyspark学习笔记（二）--- spark部署及spark-submit命令简介

Pyspark学习笔记（二）--- spark部署及spark-submit命令简介

01

Spark之三大集群模式—详解（3）

Standalone集群使用了分布式计算中的master-slave模型， master是集群中含有master进程的节点 slave是集群中的worker节点含有Executor进程

02

scala中spark运行内存不足

发现其原因竟然是运行的时候默认的内存不足以支撑海量数据，可以用 bash spark-submit --help 中查看到自己代码的运行内存，即：

03

Spark部署模式与作业提交

需要注意的是：在集群环境下，application-jar 必须能被集群中所有节点都能访问，可以是 HDFS 上的路径；也可以是本地文件系统路径，如果是本地文件系统路径，则要求集群中每一个机器节点上的相同路径都存在该 Jar 包。

03

【Spark研究】Spark之工作原理

基本概念理解Spark的运行模式涉及一系列概念：（1）Cluster Manager：在集群上获取资源的外部服务。目前有三种类型：1. Standalone, Spark原生的资源管理；2. Apache Mesos, 和Hadoop Mapreduce兼容性良好的资源调度框架；3. Hadoop Yarn, 主要指YARN中的ResourceManager. （2）Application: 用户编写的应用应用程序。（3）Driver: Application中运行main函数并创建的SparkC

05

Pyspark学习笔记（二）--- spark-submit命令

http://spark.apache.org/docs/latest/submitting-applications.html#submitting-applications,

02

聊聊spark-submit的几个有用选项

我们使用spark-submit时，必然要处理我们自己的配置文件、普通文件、jar包，今天我们不讲他们是怎么走的，我们讲讲他们都去了哪里，这样我们才能更好的定位问题。我们在使用spark-submit把我们自己的代码提交到yarn集群运行时，spark会在yarn集群上生成两个进程角色，一个是driver，一个是executor，当这两个角色进程需要我们传递一些资源和信息时，我们往往会使用spark-submit的选项来进行传递。那么这些资源和信息，在使用spark-submit指定了之后，都去了哪里呢，

03

大数据基础系列之提交spark应用及依赖管理

在Spark的bin目录下的spark-submit脚本用于提交一个任务到集群中。因为是针对所有的集群管理器统一接口(local，Standalone，yarn，mesos)，所以不必为每一个集群管理器进行特殊的配置。一，打包应用的依赖如果你的代码依赖于其它工程，你需要将它们和你的应用一起打包，目的是将这些代码分发到Spark集群中去。为了达到这个目的，需要创建一个assembly jar或者super jar，这个jar要同时包含你的代码和它的依赖。Sbt和maven都有assembly 插件。在创

09

Spark2.3.0 使用spark-submit部署应用程序

Spark的 bin 目录中的 spark-submit 脚本用于在集群上启动应用程序。可以通过一个统一的接口使用 Spark 所有支持的集群管理器，因此不必为每个集群管理器专门配置你的应用程序。

04

提交Spark作业 | 科学设定spark-submit参数

关于spark-submit的执行过程，读Spark Core的源码能够获得一个大致的印象。

02

Python大数据之PySpark(二)PySpark安装

spark-submit 提交圆周率的计算代码 */examples/src/main/python/pi.py*

03

Spark快速入门系列(7) | Spark环境搭建—standalone(4) 配置Yarn模式

官方文档地址：http://spark.apache.org/docs/latest/running-on-yarn.html

02

读书 | Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

周末的任务是更新Learning Spark系列第三篇，以为自己写不完了，但为了改正拖延症，还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行过程（本地+集群），性能调优以及Spark SQL相关的知识，如果对Spark不熟的同学可以先看看之前总结的两篇文章： Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性第七章主要讲了Spark的运行架构以

06

Apache Spark 2.2.0 中文文档 - Submitting Applications | ApacheCN

spark运行方式及其常用参数

yarn cluster模式：spark driver和application master在同一个节点上 yarn client模式：spark driver和client在同一个节点上，支持shell

02

Spark-Submit 和 K8S Operation For Spark

本文翻译自 Lightbend 的一篇文章，文章日期还比较新，2019/02/26。文章分为两部分，翻译也将分为两个部分。附上文章链接如下:

02

【Spark on K8S】Spark里的k8s client

目前在我们的应用下，会有这样的一种特殊的场景。比如说 Driver 创建在 A 集群，但是需要 Driver 将 Executor Pod 创建到 B 集群去。所以我们这里会有两个集群的 master url，分别是集群 A 和集群 B。那么创建任务的模式就是 spark-subtit 的 master url 指向集群 A，然后给 Driver 的 k8s client 设置其创建 Executor Pod 的 master url 指向 B，那么在现有 Spark 的参数下，能否直接通过 SparkConf 或者环境变量来实现这一点呢？我们看看源码。对于这样的需求，我们首先需要去了解 Spark 是如何跟 k8s 集群打交道的。Spark on K8S 在 submit 的时候默认是直接在 K8S Master 节点提交，通过 --master 或者 SparkConf 中的 spark.master 来指定。

02

Spark on K8S 在有赞的实践

随着近几年业务快速发展与迭代，大数据的成本也水涨船高，如何优化成本，建设低成本高效率的底层服务成为了有赞数据基础平台2020年的主旋律。本文主要介绍了随着云原生时代的到来，经历7年发展的有赞离线计算平台如何拥抱云原生，通过容器化改造、弹性伸缩、大数据组件的错峰混部，做到业务成倍增长的情况下成本负增长。

01

Spark on Yarn资源调优

Spark是专为大规模数据处理而设计的快速通用的计算引擎，具有速度快、支持多语言、移植性高的特点。而移植性高的体现就在于Spark的部署方式有多种模式，如：本地local、Standalone、Apache Mesos、Hadoop YARN、EC2、Mesos、K8S等等。

04

Spark资源调优

Spark 作者：章华燕编辑：龚赛概述 1 在开发完Spark作业之后，就该为作业配置合适的资源了。Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。很多Spark初学者，通常不知道该设置哪些必要的参数，以及如何设置这些参数，最后就只能胡乱设置，甚至压根儿不设置。资源参数设置的不合理，可能会导致没有充分利用集群资源，作业运行会极其缓慢；或者设置的资源过大，队列没有足够的资源来提供，进而导致各种异常。总之，无论是哪种情况，都会导致Spark作业的运行效

07

spark出现GC overhead limit exceeded和java heap space

spark执行任务时出现java.lang.OutOfMemoryError: GC overhead limit exceeded和java.lang.OutOfMemoryError: java heap space 最直接的解决方式就是在spark-env.sh中将下面两个参数调节的尽量大 export SPARK_EXECUTOR_MEMORY=6000M export SPARK_DRIVER_MEMORY=7000M 注意，此两个参数设置需要注意大小顺序： SPA

09

Spark简介

2）文档查看地址：https://spark.apache.org/docs/3.1.3/

02

【Spark篇】---Spark中yarn模式两种提交任务方式

Spark可以和Yarn整合，将Application提交到Yarn上运行，和StandAlone提交模式一样，Yarn也有两种提交任务的方式。

03

Spark快速入门系列(2) | Spark 运行模式之Local本地模式

Local 模式就是指的只在一台计算机上来运行 Spark. 通常用于测试的目的来使用 Local 模式, 实际的生产环境中不会使用 Local 模式.

02

Spark Operator 是如何提交 Spark 作业

本文将 Spark 作业称为 Spark Application 或者简称为 Spark App 或者 App。目前我们组的计算平台的 Spark 作业，是通过 Spark Operator 提交给 Kubernetes 集群的，这与 Spark 原生的直接通过 spark-submit 提交 Spark App 的方式不同，所以理解 Spark Operator 中提交 Spark App 的逻辑，对于用户来说是非常有必要的。本文将就其具体的提交逻辑，介绍一下。

03

【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL

周末的任务是更新Learning Spark系列第三篇，以为自己写不完了，但为了改正拖延症，还是得完成给自己定的任务啊 = =。这三章主要讲Spark的运行过程（本地+集群），性能调优以及Spark SQL相关的知识，如果对Spark不熟的同学可以先看看之前总结的两篇文章：【原】Learning Spark (Python版) 学习笔记(一)----RDD 基本概念与命令【原】Learning Spark (Python版) 学习笔记(二)----键值对、数据读取与保存、共享特性 #####我是

Spark简介

2）文档查看地址：https://spark.apache.org/docs/3.1.3/

03

Note_Spark_Day02：Standalone集群模式和使用IDEA开发应用程序

可以发现在一个Spark Application中，包含多个Job，每个Job有多个Stage组成，每个Job执行按照DAG图进行的。

02

Spark 在Yarn上运行Spark应用程序

在 YARN 中，每个应用程序实例都有一个 ApplicationMaster 进程，该进程是为该应用程序启动的第一个容器。应用程序负责从 ResourceManager 上请求资源。一旦分配了资源，应用程序将指示 NodeManagers 启动容器。ApplicationMasters 消除了对活跃客户端的依赖：启动应用程序的进程可以终止，并且从在集群上由 YARN 管理的进程继续协作运行。

01

EMR入门学习之通过SparkSQL操作示例（七）

导语：Spark 为结构化数据处理引入了一个称为 Spark SQL 的编程模块。它提供了一个称为 DataFrame 的编程抽象，并且可以充当分布式 SQL 查询引擎。

03

Spark性能优化 (4) | JVM 调优

根据 Spark 静态内存管理机制，堆内存被划分为了两块，Storage 和 Execution。

03

Spark 性能调优之资源调优

在大数据计算领域，Spark已经成为了越来越流行、越来越受欢迎的计算平台之一。Spark的功能涵盖了大数据领域的离线批处理、SQL类处理、流式/实时计算、机器学习、图计算等各种不同类型的计算操作，应用范围与前景非常广泛。在美团•大众点评，已经有很多同学在各种项目中尝试使用Spark。大多数同学（包括笔者在内），最初开始尝试使用Spark的原因很简单，主要就是为了让大数据计算作业的执行速度更快、性能更高。

03

Spark提交任务的不同方法及执行流程

了解Spark架构原理及相关任务提交流程前，我们需要先了解一下Spark中的一些角色概念。

02

Spark入门- Spark运行Local本地模式

Spark-shell 是 Spark 给我们提供的交互式命令窗口(类似于 Scala 的 REPL)

01

Spark性能调优篇七之JVM相关参数调整

由于Spark程序是运行在JVM基础之上的，所以我们这一篇来讨论一下关于JVM的一些优化操作。在开始JVM调优操作之前，我们先通过一张图看一下JVM简单的内存划分情况。

01

Spark优化(二)----资源调优、并行度调优

在开发完Spark作业之后，就该为作业配置合适的资源了。Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。很多Spark初学者，通常不知道该设置哪些必要的参数，以及如何设置这些参数，最后就只能胡乱设置，甚至压根儿不设置。资源参数设置的不合理，可能会导致没有充分利用集群资源，作业运行会极其缓慢；或者设置的资源过大，队列没有足够的资源来提供，进而导致各种异常。总之，无论是哪种情况，都会导致Spark作业的运行效率低下，甚至根本无法运行。因此我们必须对Spark作业的资源使用原理有一个清晰的认识，并知道在Spark作业运行过程中，有哪些资源参数是可以设置的，以及如何设置合适的参数值。

02

[源码剖析]Spark读取配置Spark读取配置

我们知道，有一些配置可以在多个地方配置。以配置executor的memory为例，有以下三种方式：

03

YARN & Mesos，论集群资源管理所面临的挑战

在国内，大部分的Spark用户都是由Hadoop过渡而来，因此YARN也成了大多Spark应用的底层资源调度保障。而随着Spark应用的逐渐加深，各种问题也随之暴露出来，比如资源调度的粒度问题。为此，7月2日晚，在CSDN Spark高端微信群中，一场基于YARN和Mesos的讨论被拉开，主要参与分享的嘉宾包括TalkingData研发副总裁阎志涛，GrowingIO田毅，AdMaster技术副总裁卢亿雷，Spark Committer、Mesos/Hadoop Contributor夏俊鸾，下面一起回顾。

05

Spark on Kubernetes PodTemplate 的配置

本文主要讲 Apache Spark 在 on Kubernetes 的 PodTemplate 的问题，以及也会讲到 Spark Operator 里关于 PodTemplate 的问题，当然也会讲到 Apache Spark 2.2 on Kubernetes 那个 Fork 的版本，感兴趣的同学可以往下看看。

03

Spark性能调优01-资源调优

在开发完Spark作业之后，就该为作业配置合适的资源了。 Spark的资源参数，基本都可以在spark-submit命令中作为参数设置。

02

Spark环境搭建——on yarn集群模式

本篇博客，Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。

02

大数据技术之_19_Spark学习_06_Spark 源码解析小结

1、spark 一开始使用 akka 作为网络通信框架，spark 2.X 版本以后完全抛弃 akka，而使用 netty 作为新的网络通信框架。最主要原因：spark 对 akka 没有维护，需要 akka 更新，spark 的发展受到了 akka 的牵制，akka 版本之间无法通信，即 akka 兼容性问题。 2、RpcEnv：RPC 上下文环境，每个 Rpc 端点运行时依赖的上下文环境称之为 RpcEnv。类似于 SparkContext，默认由 NettyRpcEnv 实现，由 NettyRpcEnvFactory 创建 RpcEnv。 3、RpcEndpoint：RPC 端点，Spark 针对于每个节点（Client/Master/Worker）都称之一个 Rpc 端点且都实现 RpcEndpoint 接口，内部根据不同端点的需求，设计不同的消息和不同的业务处理，如果需要发送（询问）则调用 Dispatcher。代理是 RpcEndpointRef。 4、Dispatcher：消息分发器，针对于 RPC 端点需要发送消息或者从远程 RPC 接收到的消息，分发至对应的指令收件箱/发件箱。 5、Inbox：指令消息收件箱，一个本地端点对应一个收件箱，Dispatcher 在每次向 Inbox 存入消息时，都将对应 EndpointData 加入内部待 Receiver Queue 中。 6、OutBox：指令消息发件箱，一个远程端点对应一个发件箱，当消息放入 Outbox 后，紧接着将消息通过 TransportClient 发送出去。 7、TransportClient：Netty 通信客户端，主要负责将相对应的 OutBox 中的数据发送给远程 TransportServer。 8、TransportServer：Netty 通信服务端，主要用于接收远程 RpcEndpoint 发送过来的消息，并把消息传送给 Dispatcher。

03

spark任务提交时绝对路径添加额外配置文件提示找不到路径

spark任务提交，添加额外配置文件时用绝对路径读取不到上传的文件。 /usr/local/spark-2.1.0-bin-hadoop2.7/bin/spark-submit --name str_platform_test_80 --master yarn --deploy-mode client --executor-cores 1 --num-executors 2 --executor-memory 1G --driver-memory 4G --conf spark.yarn.queue=rad

03

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

扫码加入开发者社群

相关资讯

热门标签

活动推荐

运营活动

活动名称

广告关闭