腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
Spark大数据应用
专栏成员
举报
1
文章
2943
阅读量
1
订阅数
订阅专栏
申请加入专栏
全部文章(1)
大数据(1)
搜索文章
搜索
搜索
关闭
如何在spark on yarn的环境中把log4j升级到log4j2
大数据
大家知道在spark on yarn中,spark的系统日志都是按照log4j的方式写到每一个node上面的container目录下的,如果要实时看一个application的日志,很麻烦!需要登录到executor所在的node上去tail一个文件,或者通过spark UI在界面上看,executor多了,这个就是麻烦事,要在不同的机器不同的目录中切换!我就在想能不能统一写到每个node的同一个地方,然后通过logstash发送到ELK里面去展示,这样在一个界面就可以看到所有application的日志了。但是这里就有1个很大的问题,log4j写的日志里面没有标明是哪个application写的日志,一大堆日志怎么知道谁是谁写的呢?所以日志里面一定要带进程号之类的标识,但是遗憾的log4j里面不支持,查了下要log4j2.9以后的版本(此时已经是log4j2了)才支持写processId,而spark3.0自带的是log4j-1.2.17.jar,所以升级的事情就来了!
跳晓爸
2021-03-17
2.9K
2
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
立即查看
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档