Loading [MathJax]/jax/input/TeX/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >Flink on Yarn运行机制

Flink on Yarn运行机制

作者头像
用户3003813
发布于 2018-09-06 05:54:30
发布于 2018-09-06 05:54:30
4K00
代码可运行
举报
文章被收录于专栏:个人分享个人分享
运行总次数:0
代码可运行

从图中可以看出,Yarn的客户端需要获取hadoop的配置信息,连接Yarn的ResourceManager。所以要有设置有 YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOOP_CONF_PATH,只要设置了其中一个环境变量,就会被读取。如果读取上述的变量失败了,那么将会选择hadoop_home的环境变量,都区成功将会尝试加载$HADOOP_HOME/etc/hadoop的配置文件。

1、当启动一个Flink Yarn会话时,客户端首先会检查本次请求的资源是否足够。资源足够将会上传包含HDFS配置信息和Flink的jar包到HDFS。

2、随后客户端会向Yarn发起请求,启动applicationMaster,随后NodeManager将会加载有配置信息和jar包,一旦完成,ApplicationMaster(AM)便启动。

3、当JobManager and AM 成功启动时,他们都属于同一个container,从而AM就能检索到JobManager的地址。此时会生成新的Flink配置信息以便TaskManagers能够连接到JobManager。同时,AM也提供Flink的WEB接口。用户可并行执行多个Flink会话。

4、随后,AM将会开始为分发从HDFS中下载的jar以及配置文件的container给TaskMangers.完成后Fink就完全启动并等待接收提交的job.

启动Flink cluster  on YARN 

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
./bin/yarn-session.sh -n 1 -jm 1024 -tm 4096

可以看到启动了1个TaskManager 给jm与tm分配的资源数

将Flink的配置与jar包上传至HDFS

提交于Application Master

启动完毕后,就可提交任务。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2015-12-17 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
Flink on Yarn运行机制 转
从图中可以看出,Yarn的客户端需要获取hadoop的配置信息,连接Yarn的ResourceManager。所以要有设置有 YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOOP_CONF_PATH,只要设置了其中一个环境变量,就会被读取。如果读取上述的变量失败了,那么将会选择hadoop_home的环境变量,都区成功将会尝试加载$HADOOP_HOME/etc/hadoop的配置文件。
stys35
2019/03/05
5050
flink on yarn部署
在zookeeper,HDFS 和Yarn的组件的安装好的前提下,在客户机上提交Flink任务,具体流程如下:
Java架构师必看
2021/08/12
2.3K0
快速入门Flink (2) —— Flink 集群搭建
上一篇博客博主已经为大家介绍了 Flink的简介与架构体系,本篇博客,我们来学习如何搭建Flink集群。
大数据梦想家
2021/01/27
2.6K0
快速入门Flink (2) —— Flink 集群搭建
一文精通flinkOnYarn
本文主要是讲解flink on yarn的部署过程,然后yarn-session的基本原理,如何启动多个yarn-session的话如何部署应用到指定的yarn-session上,然后是用户jar的管理配置及故障恢复相关的参数。
Spark学习技巧
2019/03/08
1.9K0
一文精通flinkOnYarn
Spark on yarn
spark on yarn是spark集群模式之一,通过resourcemanager进行调度,较之standalone模式,不需要单独启动spark服务。
阿dai学长
2020/03/09
1.6K0
Spark on yarn
Flink on yarn初步讲解
对于flink的基本概念和基本运行模式讲解的内容请参考这篇文章《Flink流式处理概念简介》。本文主要是讲解flink on yarn的运行原理及基本使用,后面会再出一篇文章将flink on yarn的部署及各种调优。
Spark学习技巧
2018/08/01
2.8K1
Flink on yarn初步讲解
2024年最新Flink教程,从基础到就业,大家一起学习--flink部署和集群部署(从本地测试到公司生产环境如何部署项目源码)
这些内容都是自己一边学习一边总结的,其中每一个知识点都是经过翻阅大量资料整理,包含一些常见的报错和报警都会详细的举例和说明,大家一起学习。
小白的大数据之旅
2024/11/20
3700
2024年最新Flink教程,从基础到就业,大家一起学习--flink部署和集群部署(从本地测试到公司生产环境如何部署项目源码)
Flink on Yarn - CDH5
根据Flink官网资料,实操CDH5.16.2上配置Flink on yarn,给出了flink on yarn的集成方式和HA的配置方式
Eights
2020/07/10
2K0
Flink on Yarn - CDH5
Flink Yarn Cluster & HA
在一个企业中,为了最大化的利用集群资源,一般都会在一个集群中同时运行多种类型的 Workload。因此 Flink 也支持在 Yarn 上面运行。首先,让我们了解下 Yarn 和 Flink 的关系。
编程那点事
2023/02/25
9780
Flink Yarn Cluster & HA
Flink on Yarn两种模式启动参数及在Yarn上的恢复
注意:系统和运行脚本在启动时解析配置.对配置文件的更改需要重新启动Flink JobManager和TaskManagers
神秘的寇先森
2020/02/19
8.5K0
2021年大数据Flink(六):Flink On Yarn模式
在实际开发中,使用Flink时,更多的使用方式是Flink On Yarn模式,原因如下:
Lansonli
2021/10/11
1.5K0
Apache Flink 零基础入门(二):开发环境搭建和应用的配置、部署及运行
我们在系列文章第一篇已经为大家介绍了 Flink 的基本概念以及安装部署的过程,希望能够帮助读者建立起对 Flink 的初步印象。这是系列文章第二篇,主要面向于初次接触 Flink 或者对 Flink 有了解但是没有实际操作过的同学。希望帮助大家更顺利地上手使用 Flink,并着手相关开发调试工作。
Java帮帮
2019/11/14
1.3K0
大数据Flink进阶(十六):Flink HA搭建配置
默认情况下,每个Flink集群只有一个JobManager,这将导致单点故障(SPOF,single point of failure),如果这个JobManager挂了,则不能提交新的任务,并且运行中的程序也会失败,这是我们可以对JobManager做高可用(High Availability,简称HA),JobManager HA集群当Active JobManager节点挂掉后可以切换其他Standby JobManager成为主节点,从而避免单点故障。用户可以在Standalone、Flink on Yarn、Flink on K8s集群模式下配置Flink集群HA,Flink on K8s集群模式下的HA将单独在K8s里介绍。
Lansonli
2023/04/08
2.8K0
大数据Flink进阶(十六):Flink HA搭建配置
大数据Flink进阶(十五):Flink On Yarn任务提交
Flink On Yarn即Flink任务运行在Yarn集群中,Flink On Yarn的内部实现原理如下图:
Lansonli
2023/04/08
6.5K0
大数据Flink进阶(十五):Flink On Yarn任务提交
[1131]Flink(1.13)命令行提交Job
请注意,客户端需要YARN_CONF_DIR或HADOOP_CONF_DIR环境变量来读取YARN和HDFS配置。没配置的话,就默认是 /etc/hadoop/conf。
周小董
2022/04/28
2.3K0
使用FLINK SQL从savepoint恢复hudi作业 (flink 1.13)
Flink从1.13版本开始支持在SQL Client从savepoint恢复作业。flink-savepoint介绍
从大数据到人工智能
2022/01/19
1.5K0
使用FLINK SQL从savepoint恢复hudi作业 (flink 1.13)
flink-2:部署flink1.13.1&hadoop3.3.1并初探
Flink自1.11.0 版本开始,已经支持了hadoop 3.x,具体来讲就是将 HADOOP_CLASSPATH 配置成运行机器上的hadoop3 相关jar包即可。
千里行走
2022/04/28
3.1K0
flink-2:部署flink1.13.1&hadoop3.3.1并初探
CentOS7.5搭建Flink1.6.1分布式集群详解
安装包下载地址:http://flink.apache.org/downloads.html  ,选择对应Hadoop的Flink版本下载
星哥玩云
2022/07/26
9590
CentOS7.5搭建Flink1.6.1分布式集群详解
Flink集群部署
上一节我们讲了单机模式如何部署启动,这节我们基于CentOS 7虚拟机搭建一个3个节点的集群:
王知无-import_bigdata
2019/03/05
4.6K0
收藏|Flink比Spark好在哪?
Flink 是一个面向分布式数据流处理和批量数据处理的开源计算平台。和 Spark 类似,两者都希望提供一个统一功能的计算平台给用户,都在尝试建立一个统一的平台以运行批量,流式,交互式,图处理,机器学习等应用。
数据社
2020/10/09
1.1K0
收藏|Flink比Spark好在哪?
相关推荐
Flink on Yarn运行机制 转
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
本文部分代码块支持一键运行,欢迎体验
本文部分代码块支持一键运行,欢迎体验