腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
Notebook
为
Spark
编写
Java
作业
、
、
我正在使用
Java
API
编写
我的第一个
Spark
作业
。 我想用笔记本来运行它。 我在调查齐柏林飞艇和朱庇特。 在齐柏林飞艇文档中,我看到了对Scala、IPySpark和SparkR的支持。我不清楚使用两个解释器%
spark
.sql %
java
是否允许我使用
Spark
SQL的
Java
API Jupyter有"IJava“内核,但我看不到
Java
对
Spark
的支持。 还有其他选择吗?
浏览 10
提问于2021-04-05
得票数 0
2
回答
当调用其他笔记本时,Databricks笔记本超时错误: com.databricks.WorkflowException:
java
.net.SocketTimeoutException: Read
、
、
、
作业
和交互式集群的设置相同,如下所示: 有什么问题吗?recent call last) 1 #Run CDMMedications 137 /da
浏览 1
提问于2019-08-16
得票数 3
回答已采纳
2
回答
如何在气流中将自定义数据传递给DatabricksRunNowOperator
、
、
、
DatabricksRunNowOperator( databricks_conn_id='databricks_default',
spark
_submit_params
浏览 6
提问于2022-08-10
得票数 2
1
回答
重新提交已停止的申请后引发异常
、
、
我正在运行一个
Spark
作业
(从
Spark
notebook
),使用带有选项的动态分配"
spark
.shuffle.service.enabled如果我取消正在运行的
作业
/应用程序(通过按下
notebook
中单元上的cancel -按钮,或者通过关闭
notebook
服务器和应用程序),并在短时间(几分钟)后重新启
浏览 14
提问于2016-08-31
得票数 1
1
回答
如何在Cloudera Quickstart下将
Spark
Notebook
设置
为
Hue?
、
、
、
我最近尝试在Hue UI中设置
Spark
Notebook
。我在VirtualBox中运行Cloudera CDH 5.8。
Spark
notebook
在Livy服务器上工作,我安装了livy服务器。我还从Hue.ini文件的黑名单中删除了
spark
。但是,我仍然不能在Hue UI中得到
Spark
Notebook
。 更新:现在我可以访问笔记本了。但是,我不能向集群提交
spark
作业
。.....Thanks to Romainr,我可
浏览 11
提问于2016-08-10
得票数 0
1
回答
查看通过Azure ADF执行的
作业
的
Spark
UI
、
、
、
我无法查看通过Azure数据工厂中的
notebook
活动执行的databricks
作业
的
spark
-ui。
浏览 5
提问于2021-11-10
得票数 0
2
回答
如何创建到远程
Spark
服务器的连接,并从运行在本地机器上的ipython中读取数据?
、
、
、
我正在本地计算机上运行ipython
notebook
,并希望创建到远程
Spark
服务器i.p的连接。然后从remote server上存在的hdfs文件夹中读取数据。如何从本地ipython
notebook
创建到
Spark
服务器的远程连接
浏览 3
提问于2015-11-24
得票数 6
1
回答
用于Azure数据库的DevOps
作业
、
、
我确实有许多databricks
作业
在我的集群上按计划运行。其中一些
作业
指向
notebook
文件,少数
作业
指向dbfs位置中的jar文件。有没有办法在azure databricks
作业
上实现devops过程,以便DEV中的任何
作业
中的任何更改都将调用构建管道,并在PROD databricks实例中部署相同的
作业
。首先,我想知道是否有可能在azure databricks
作业
上实现devops。 感谢任何线索!
浏览 3
提问于2020-11-27
得票数 2
1
回答
无法在客户端模式Kubernetes中运行pyspark
作业
。
、
、
name: my-
notebook
-deployment app: my-
notebook
replicas: 1 matchLabels: template: labels: spec::--- apiV
浏览 4
提问于2020-10-19
得票数 0
回答已采纳
2
回答
数据库SparkSQL
作业
、
、
Databricks是否支持提交类似于Google Cloud Dataproc的SparkSQL
作业
? Databricks job API似乎没有用于提交
Spark
SQL
作业
的选项。
浏览 41
提问于2020-07-01
得票数 0
2
回答
如何在Databricks笔记本中使用气流变量?
、
、
、
notebook
_task = { 'base_parameters': {"token": token} 和这里定义的运算符 opr_submit_run = DatabricksSubmitRunOperator( task_id='run_
notebook
existing_clus
浏览 42
提问于2021-07-13
得票数 2
回答已采纳
1
回答
在databricks上打包scala类(错误:未找到:值dbutils)
、
、
{StructField, StructType}import
java
.text.SimpleDateFormatimport
spark
.implicits._ ... } 在同一个笔记本上一切运行正常,但一旦我尝试创建可以在其他笔记本中使用的包,我就会遇到错误: <
notebook
>:11: error: not found: o
浏览 16
提问于2019-05-24
得票数 0
回答已采纳
1
回答
工人容器未能连接回火花驱动程序
、
然后,我运行命令将my_
notebook
映像设置
为
: docker my_
notebook
。然后我制作了三个容器master: command: bin/
spark
-class org.apache.
spark
.deploy.master.Master/data:/tmp/data
notebook
:
浏览 1
提问于2019-01-22
得票数 1
回答已采纳
2
回答
如何从另一个具有“不同集群”的笔记本中运行DataBricks笔记本
我让
notebook
1在cluster1上运行,我使用下面的命令从
notebook
1运行
notebook
2但是这将在cluster1
浏览 22
提问于2022-02-07
得票数 2
2
回答
Databricks
Spark
notebook
在运行之间重用Scala对象?
、
、
、
、
我已经
编写
了一个Azure Databricks scala笔记本(基于JAR库),并且我每小时使用Databricks
作业
来运行它。在代码中,我使用Application Insights
Java
SDK进行日志跟踪,并初始化一个标记"RunId“的GUID。."); val properties = new
java
.util.HashMap[String, String]()tracer.trackEvent(nam
浏览 2
提问于2018-08-06
得票数 0
回答已采纳
2
回答
是否更改
Spark
Web UI的根路径?
、
、
、
、
我定义了一个顶级函数,它允许用户创建一个指向Kubernetes master URL的SparkSession,并将他们的pod设置
为
Spark
driver。这一切都很好,但我希望最终用户能够访问
Spark
Web UI的URL,以便他们可以跟踪他们的
作业
。servicePort: app-svc-port
浏览 44
提问于2019-05-30
得票数 2
1
回答
如何在Databricks中终止
作业
、
、
我有一个长期运行的
作业
,如果满足某些条件,我会终止该
作业
。这通常是在python中完成的,如下所示: exit('job failed!)如何
编写
Databricks python脚本,以便在满足特定条件时自动停止执行?
浏览 21
提问于2018-09-05
得票数 4
回答已采纳
1
回答
在jupyter
notebook
中使用胶水
作业
阅读Kinesis Stream
、
、
、
我正尝试在AWS提供的jupyter笔记本电脑中使用
spark
/ python读取kinesis流。我从AWS文档中获取了代码,但当我尝试使用kinesis创建数据帧时,我得到了一个依赖错误。KinesisUtils, InitialPositionInStream glueContext = GlueContext(sc)job = Job(glueContext) #ssc = Stre
浏览 10
提问于2021-07-20
得票数 0
1
回答
如何查找在计算机不同内核中创建的
Spark
RDD
、
、
我只是想更多地了解
Spark
。所以我想问这个问题。我连接了一个运行Pyspark的Jupyter笔记本。所以,现在当我在笔记本中进行任何编码时,比如读取数据并将数据转换为
Spark
DataFrame,我想检查一下: 1)。其中所有数据集都分布在本地机器上。使用没有
spark
的Jupyter
notebook
运行代码和计算与使用Pyspark运行Jupyter
notebook
是不同的?像第一个一样,只使用机器的一个
浏览 0
提问于2016-08-13
得票数 0
2
回答
用火花放电把DataFrame从笔记本传给另一个
、
、
、
我试图调用我在
notebook
1中创建的一个
notebook
1,以便在数据库社区添加的
notebook
2中使用它,并且我尝试了这个代码dbutils.
notebook
.run("
notebook
1",py4j.Py4JException:方法_run(类
java
.lang.String,类
java
.lang.Integer,类
java
.util.HashSet,null,类
java
.lang.String
浏览 9
提问于2022-08-08
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
pyspark 安装
在Apache Hadoop 中运行深度学习框架
PySpark安装+Jupyter Notebook配置
Azkaban支持哪些类型的作业?
Spark 2.4重磅发布:优化深度学习框架集成,提供更灵活的流式接收器
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券