腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
2
回答
如何
指定
多个
shell
脚本
作为
Dataproc
集群
创建
的
初始化
操作
?
、
、
谷歌
的
文档中说,--initialization-actions采用了GCS
的
列表。如果我
指定
了一个: --initialization-actions 'gs://my-project/myscript.sh' 这可以很好地工作。/my-project/myscript.sh', 'gs://my-project/myscript2.sh']' URI must begin with 'gs
浏览 33
提问于2021-01-23
得票数 1
回答已采纳
1
回答
从composer在
dataproc
集群
上执行bash
脚本
、
我想在使用一个简单
的
shell
脚本
创建
一个
dataproc
集群
后,将jars添加到该
集群
的
特定位置。一旦
创建
了
dataproc
集群
,下一步就是执行bash
脚本
,该
脚本
将把jar添加到data proc
集群
中。 您能建议使用哪个airflow
操作
符在
dataproc
集群
上执行bash
脚本
浏览 21
提问于2019-05-08
得票数 2
2
回答
集群
创建
后
如何
在GCP上运行
集群
初始化
脚本
、
、
我已经
创建
了Google
集群
,但是需要安装presto,因为我现在有一个要求。Presto
作为
Dataproc
上
的
初始化
操作
提供,
如何
在
创建
集群
后运行此
初始化
操作
。
浏览 4
提问于2017-10-20
得票数 0
回答已采纳
2
回答
如何
组合和测试google
dataproc
--
初始化
-
操作
不清楚是否接受
多个
args。Docstring错误/不标准。-
初始化
-行动a、b、c 当它失败时,
如何
在几秒钟内而不是几分钟内调试.即
脚本
不完整
创建
步骤?
浏览 0
提问于2018-02-21
得票数 2
回答已采纳
1
回答
Dataproc
在
dataproc
上安装动物园管理员最新版本,
作为
群集
创建
的
动物园管理员仲裁模式。
、
、
、
有谁知道
如何
在
dataproc
上安装动物园管理员
的
最新版本
作为
动物园管理员仲裁模式。而
集群
创建
。On latest
dataproc
version 2.0 (Debian 10, Hadoop 3.2, Spark 3.1) 在
dataproc
上安装动物园管理员有两种方法,一种是使用
初始化
操作
脚本
,另一种方法是选择
作为
可选组件
的
动物园管理员,而
集群</
浏览 6
提问于2021-12-10
得票数 2
1
回答
如何
使用Airflow DataprocOperator在谷歌
DataProc
集群
上运行
shell
脚本
、
、
一旦设置好
集群
,我就会尝试在
Dataproc
集群
中运行
shell
脚本
。我卡住了,或者不确定要传递给
操作
员
的
参数是什么,以便在
集群
启动并运行后触发.sh文件。
创建
集群
的
Airflow示例代码: create_cluster = DataprocClusterCreateOperator( task_id='create_
dataproc
_clusterstorage
浏览 31
提问于2019-02-01
得票数 2
1
回答
提交有关
dataproc
的
Presto作业
、
我试图在运行Presto
的
集群
上提交一个带有postgresql连接器
的
dataproc
作业。
集群
被
初始化
如下: --project=${PROJECT} \ --scopes=cloud-platform \$
浏览 0
提问于2019-08-27
得票数 3
回答已采纳
2
回答
如何
在
Dataproc
上安装木星/iPython?
当我
创建
新
集群
时,
如何
自动安装和配置它?
浏览 6
提问于2015-10-13
得票数 3
回答已采纳
1
回答
我没有找到NodeInitializationAction
的
证据,因为
Dataproc
已经运行。
、
dataproc
.create
操作
。我可以看到正在
创建
集群
,但是当我将ssh放入主计算机(在us-central1 1-f中
的
“cat-m”)时,我没有看到我
指定
的
脚本
被复制或运行
的
任何证据。(编辑:我在/etc/google-
dataproc
/startup-scripts/
dataproc
-initialization-script-0).中找到了
浏览 2
提问于2016-12-22
得票数 4
回答已采纳
1
回答
由于Cloud代理
初始化
错误导致Google群集
创建
失败
、
、
、
我正在尝试使用
Dataproc
of Airflow从一个Cloud Composer DAG
创建
一个DataprocCreateClusterOperator
集群
。我需要从我
的
Cloud SQL
集群
访问
Dataproc
,因此也需要在
集群
上安装Cloud SQL proxy。我在
集群
配置中为Cloud SQL Proxy
操作
符提供了
的
初始化
操作
,如下所示: "initia
浏览 1
提问于2022-07-09
得票数 2
3
回答
是否可以使用Google
Dataproc
上
的
初始化
脚本
向
集群
提交作业?
、
我在1个
集群
上使用1个作业
的
Dataproc
。 我希望在
创建
群集后立即开始我
的
作业。我发现实现这一点
的
最佳方法是使用如下所示
的
初始化
脚本
提交作业。gcloud
dataproc
jobs submit pyspark ...export -f submit_job echo "checkinggcloud
dataproc
浏览 54
提问于2021-09-03
得票数 3
回答已采纳
1
回答
由于SSD标签错误,无法
创建
dataproc
群集。
、
在过去几周中,我使用以下gcloud命令成功地
创建
了
dataproc
集群
: gcloud
dataproc
-区域us-east1 1
集群
创建
test1 -子网默认值-zone us-east1 1--标准-4-主引导磁盘大小为250 -num-工人10 -工-机器类型n1-标准-4-工-引导-磁盘-大小200 -num-工人-ssds 1-图像-版本1.2 -范围'‘-项目MyProject -
初始化
-
操作
://MyB
浏览 2
提问于2018-01-19
得票数 2
回答已采纳
1
回答
GCP
Dataproc
自定义图像Python环境
、
、
、
我有一个问题,当我
创建
一个
DataProc
自定义图像和Pyspark。我
的
自定义镜像基于
DataProc
1.4.1-debian9,并使用我
的
初始化
脚本
从一个requirements.txt文件安装python3和一些包,然后设置python3环境变量以强制pyspark但是,当我在使用此镜像
创建
的
集群
上提交作业时(为简单起见,使用单节点标志),该作业找不到已安装
的
包。如果我登录
集群</e
浏览 23
提问于2019-07-12
得票数 7
回答已采纳
1
回答
无法在GCP上
的
dataproc
集群
中导入pyspark
、
、
我只是在Google平台上安装了一个
集群
来运行一些火花缭乱
的
作业。最初,我使用ipython.sh (来自github存储库)
作为
集群
的
初始化
脚本
。经过一些搜索之后,我认为这与Python中没有包含
的
pyspark安装路径有关,所以我删除了我
的
集群
,并希望
创建
一个新
的
集群
,使用jupyter.sh
作为
初始化
脚本
浏览 2
提问于2016-09-19
得票数 1
1
回答
当我对Dataframe执行
操作
时发生了错误,这是我手动
创建
的
。
、
、
、
、
我有一个字符串
的
python列表。我用下面的代码用一个列
创建
了一个dataframe:其中,temp是字符串
的
列表。当我试图在skills_df上做任何像skills_df.count()这样
的
操作
时,它会给我一个错误。这种情况发生在数据处理上。但是,不是通过导入csv文件(即csv_df = spark.read.csv('/user/turing/Pro
浏览 1
提问于2018-04-26
得票数 0
回答已采纳
2
回答
如何
知道何时执行
dataproc
初始化
操作
我需要运行一个同时安装了
Dataproc
和cluster连接器
的
BigQuery
集群
。我可以通过简单地在每个节点上重新启动
dataproc
代理来修复这个问题,但是我确实需要这样做才能在
集群
创建
后立即运行作业。& disown
如何
知道
初始化
操作
已经完成?我是否已经/
如何
正确地重新启动
Dataproc
代理(我新
创建
的</e
浏览 2
提问于2018-09-04
得票数 0
回答已采纳
1
回答
暂停
Dataproc
集群
- Google计算引擎
、
是否有一种暂停
Dataproc
集群
的
方法,这样当我没有主动运行星际争霸或火花提交作业时,就不会收到账单了吗?此链接上
的
群集管理说明: 只显示
如何
销毁一个
集群
,但我已经安装了火花卡桑德拉连接器API,例如。除了
创建
每次需要安装
的
映像之外,我唯一
的
选择是吗?
浏览 6
提问于2016-01-01
得票数 8
回答已采纳
1
回答
与
Dataproc
集群
的
色调集成
、
、
是否存在将色调与
dataproc
集群
集成
的
方法?
浏览 0
提问于2020-02-13
得票数 3
回答已采纳
2
回答
如何
在启动
的
星火
集群
中启用Snappy编解码器支持?
、
、
、
、
当试图从使用启动
的
Spark
集群
中读取快速压缩序列文件时,我收到以下警告: java.lang.RuntimeException: native snappy library not available在这种情况下启用Snappy编解码器支持
的
最佳方法是什么?
浏览 3
提问于2015-09-28
得票数 4
回答已采纳
1
回答
在GCP
集群
上运行Dask
脚本
、
我是#GCP
的
新手,我
的
问题可能看起来微不足道(很抱歉)。我已经使用Dask开发了我
的
python代码
的
分布式版本。现在,我将在#Google_Cloud上检查代码
的
可伸缩性和性能。为此,我将使用"
dataproc
“来
创建
一个
集群
。但我
的
问题是,我不知道
如何
在
集群
上运行我
的
python-dask
脚本
。据我所知,我应该在
dataproc
上
浏览 10
提问于2019-02-09
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Linux Shell脚本必知必会
LoadRunner通过SSH模拟故障连接
Redis Cluster集群快速搭建
6 段常用linux 实战命令
linux运维——基础篇
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券