腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何将jar添加到正在运行
的
spark上下文中?
、
为了详细说明,我使用
livy
创建
一个
spark
会话
,然后将作业提交给
在
同一spark
会话
中运行它们
的
livy
客户端。现在,如果我需要在其中
一个
作业中添加
一个
新
的
jar
作为
依赖项,有没有办法将该jar放入正在运行
的
spark
会话
中? 我尝试过spark.jars,但它只
在
创建
会话</em
浏览 0
提问于2018-05-15
得票数 1
1
回答
在
Livy
上
创建
一个
新
会话
作为
另一个
会话
的
副本
、
、
、
我使用
livy
来使用Spark
作为
服务。我
的
应用程序将一些命令
作为
代码发送给
livy
,然而,spark需要初始化一些变量(读取一些文件,进行一些map&reduce操作等)。这需要时间。此初始化部分对于所有
会话
都是通用
的
。
在
构造之后,可以将不同
的
语句发送到这些
会话
。 我想知道
的
是,当
livy
创建
会话
时,是否可以复制旧
的
<
浏览 14
提问于2016-09-21
得票数 1
回答已采纳
3
回答
在
python中使用
livy
时响应对象
的
状态为“dead”
、
、
、
我正在尝试使用
livy
,这也是我第一次使用REST api。跟随,当我键入然后我接收
作为
输出
的
根据本教程,
会话
状态应该是iddle,但在启动完成后,它似乎会更改为dead。我不知道该怎么做才能将状态保持
在
iddle中,这样我才能发出post请求。在运行服务器
的
控制台中,我收到以下输出16/08/02
浏览 11
提问于2016-08-02
得票数 0
回答已采纳
3
回答
Livy
会话
错误
在
Jypyter中与火花魔术-错误repl.PythonInterpreter:进程已死亡1
、
、
、
我正在运行
一个
Sparkv2.0.0纱线集群。我让
livy
在
火星之主旁边跑。
在
jupyter
的
“管理火花”部分中
创建
新
会话
时,从
Livy
日志中获得
的
错误 17/02/10 13:06:08 INFO Stat
浏览 10
提问于2017-02-10
得票数 2
回答已采纳
1
回答
K8S
上
的
Livy
,名称空间限制
、
、
、
我
在
特定命名空间中
的
K8S
上
运行了spark (3.0.1)、
livy
(0.8.0)和Jupyterhub (火花魔术),Kubernetes master
作为
资源管理器使用。当我试图
在
木星中心
的
笔记本中
创建
pyspark
会话
时,我得到了
一个
错误: 22/02/04 12:09:16警告InteractiveSession:未能阻止RSCDriver。杀了它。配置
的
服务帐户没
浏览 21
提问于2022-02-07
得票数 0
1
回答
如何在Nifi ExecuteSparkINteractive处理器中管理‘等待’状态?
、
、
我正在使用Nifi ExecuteSparkInteractive处理器运行spark代码,我看到它
的
结果是成功、失败和等待。当结果进入成功和失败状态时,我能够很好地管理和路由结果,但有时我看到文件丢失,我认为它将处于等待状态,并且
在
我
的
Nifi流中没有为“等待”状态定义路由。谁能帮助我理解什么是“等待”状态,以及如何在不影响最终结果
的
情况下路由此状态下
的
控件。 提前谢谢你!我尝试将nifi控件路由到UpdateAttribute处理器,但我看不到任何来自spark代码
的
结果。看起来<e
浏览 1
提问于2019-06-23
得票数 2
2
回答
木星替代齐柏林飞艇:多语种星火
、
、
、
主要是拥有多语种星火支持--
在
木星中是否有可能
创建
一个
可以通过R、Scala、Python和SQL访问
的
星火数据框架,所有这些都在同
一个
笔记本中?我们已经编写了Scala库来
创建
数据框架并将其返回给用户,用户可能希望使用各种语言来操作/查询数据框架。
在
木星环境中,是解决这个问题
的
解决方案吗?我无法从
Livy
的
网站上判断给定
的
连接是否只支持一种语言,或者每个
会话
是否可以有
浏览 2
提问于2018-08-14
得票数 3
1
回答
将jar上载到Apache交互式
会话
、
、
、
使用亚马逊emr-5.30.1配
Livy
0.7和Spark2.4.5curl -X POST \ -d '{"conf": {"kind" : "spark","jars": "s3://cjspro-emr-da
浏览 2
提问于2020-07-16
得票数 1
1
回答
运行spark notebook原型代码
的
动态方法
、
一旦我使用Spark notebook
创建
了Scala代码
的
原型,我就会将相关
的
单元复制到
一个
脚本文件中,这个脚本文件是我从Apache Spark CLI调用
的
。有没有一种更惯用
的
方式来帮助代码重用? 那么,与其从spark notebook
创建
脚本文件,还不如通过api调用运行notebook本身?
浏览 0
提问于2017-05-03
得票数 1
1
回答
关于AWS EMR星火上木星中心
的
Livy
会议
、
我
的
客户
在
AWS EMR
上
安装了
一个
安装在木星集线器
上
的
AD连接器,以便通过AD
在
Jupyterhub
上
验证不同
的
用户。目前
的
理解是,当不同
的
用户通过木星中心上
的
木星笔记本向共享
的
EMR火花引擎提交他们
的
火花作业时,火花作业将通过
Livy
提交给火花引擎。每个
Livy
会议都将有
一个
相关
的
浏览 0
提问于2018-12-24
得票数 2
回答已采纳
1
回答
Apache
Livy
- Rest API
、
在网上浏览之后,我认为
Livy
可以用来做这件事。
Livy
已经安装了HDP 2.5。因此,我使用POST/Sessions
创建
了
新
的
Livy
会话
,并包含了我
的
jar文件。注意:- jar必须放在HDFS中才能正常工作 根据
Livy
的
示例:- https://
livy
.apache.org/examples/我可以将代码片段
作为
&qu
浏览 32
提问于2020-03-30
得票数 0
3
回答
如何在电子病历集群引导
上
设置
livy
.server.session.timeout?
、
、
我正在
创建
一个
EMR集群,并使用jupyter notebook运行一些spark任务。我
的
任务
在
执行大约1小时后就会死掉,错误是:Invalid status code '400' from https://xxx.xx.x.xxx:我
的
理解是它与
Livy
config
livy
.server.session.timeout相关,但是我不知道如何在集群
的
引导
浏览 2
提问于2019-01-16
得票数 13
回答已采纳
1
回答
如何确定Apache
的
“允许
的
最大活动
会话
计数”?
、
、
、
比方说,我想继续为提交给纱线
的
每个火花作业
创建
一个
会话
。每个连接都有
一个
唯一
的
用户,该用户一直
在
轮询状态和将语句发送到
会话
。我如何计算,在任何给定
的
时间里,
Livy
可以有多少个活动
会话
?是基于我配置
的
livy
.spark.driver大小吗?这个计算所涉及
的
其他参数是什么?
浏览 1
提问于2019-09-11
得票数 1
3
回答
通过http运行
livy
作业,而无需每次都上传jar
、
、
我正在使用
Livy
/Spark,我对如何使用其中
的
一些感到有点困惑。
在
livy
examples文件夹中有
一个
上传到spark
的
构建作业
的
示例。我喜欢正在使用
的
接口,但我想通过http连接到
livy
/spark,因为我没有java客户端。这样看来,如果我使用livyclient上传jars,它只存在于那个spark
会话
中。老实说,我正在试图弄清楚最好
的
方法是什么。我希望能够通过s
浏览 2
提问于2018-05-12
得票数 1
1
回答
是否可以使用固定
的
Spark上下文池并行运行多个spark作业?
我是Spark
的
新手,所以任何建议,无论是关于相关工具或针对我
的
用例建议
的
设计更改,都将不胜感激。我目前
的
情况是,我有几百万个独立
的
Spark作业,运行时间不是很长(平均几秒钟),我使用
Livy
以批处理模式提交它们。问题是,初始化每个作业
的
Spark上下文所需
的
时间比运行作业本身所需
的
时间要长得多。因此,我
的
想法是初始化spark上下文
的
修复池,并使用它们来运行所有这些作业,而不是每次运行作业时都获
浏览 2
提问于2021-09-06
得票数 1
1
回答
成功
创建
spark上下文后,
Livy
会话
继续启动
、
、
、
我一直
在
尝试用运行在Ubuntu 18.04
上
的
Livy
0.7服务器
创建
一个
新
的
spark
会话
。
在
同一台机器
上
,我有
一个
具有2个工作进程
的
正在运行
的
spark集群,并且我能够
创建
一个
普通
的
spark-session。我
的
问题是,
在
向
Livy</em
浏览 40
提问于2020-06-03
得票数 5
1
回答
批模式错误中
的
livy
抛出错误:只支持本地python文件:解析参数
、
、
、
我尝试
在
批处理模式下执行
livy
,方法是提交
一个
python文件,但是它不起作用,我尝试了两种方法- hduser@tarun-ubuntu:/home/tarun/spark/examples/src/main/python$ curl
浏览 1
提问于2016-10-28
得票数 1
1
回答
Spark内核笔记本之间
的
集群共享
、
、
、
、
我希望从概念
上
理解
在
Spark内核(如SparkMagic)
上
运行
的
几个Jupyter笔记本如何共享
一个
工作节点集群。如果用户A
在
计算单元中持续或缓存了
一个
大
的
RDD (无论是
在
磁盘上还是在内存中),然后出去度周末,但没有停止他/她
的
笔记本,这是否会降低其他用户在用户A
的
笔记本运行时运行其作业
的
能力?也就是说,共享集群
的
所有Spark notebooks
浏览 20
提问于2021-01-25
得票数 1
1
回答
更改EMR集群中
Livy
使用
的
Python版本
、
、
Livy
继续使用Python2.7,不管使用什么。注意:这在运行
Livy
0.7.0
的
另一个
EMR集群中没有任何问题,我已经遍历了<em
浏览 6
提问于2021-05-03
得票数 2
2
回答
如何使用AirFlow提取使用Apache批处理POST方法提交
的
火花作业客户端日志
、
、
这个HTTP请求是使用AirFlow发送
的
。提交作业后,我使用批处理Id跟踪状态。我想在气流日志
上
显示驱动程序(客户端日志)日志,以避免AirFLow和Apache /Resource访问多个地方。 使用Apache可以这样做吗?
浏览 4
提问于2019-01-20
得票数 4
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Livy,基于Apache Spark的开源REST服务,加入Cloudera Labs
导出域内用户hash的几种方法
使用 TLS 加密保护 VNC 服务器的简单指南
加速Kubernetes部署的最佳实践
认识 MongoDB 4.0 的新特性——事务
热门
标签
更多标签
云服务器
ICP备案
云直播
对象存储
腾讯会议
活动推荐
运营活动
广告
关闭
领券