腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
Dataproc
上
的
Zookeeper
、
我需要一个关于在
Dataproc
上
设置
Zookeeper
集成
的
建议。手头
的
场景是一个项目,它将有3个长期运行
的
Dataproc
集群,以及每个作业动态创建
的
许多临时集群。我希望至少有7名动物园管理员组成法定人数,但还没有找到任何如何做到这一点
的
文档。 我知道我可以将
Zookeeper
组件添加到每个
Dataproc
集群,但是如何创建由多个集群组成
的
集成呢?
浏览 15
提问于2020-07-29
得票数 0
1
回答
使用导入Bigtable中
的
CSV数据
、
我试图使用
Dataproc
集群
的
一个实例将大型CSV文件导入到HDFS,然后将它们导出为格式,最后将最新版本导入到Bigtable,如下所述:我似乎无法让HBase shell或
ZooKeeper
在
dataproc
主VM
上
运行,因此我无法从CLI运行一个简单
的</
浏览 4
提问于2015-09-30
得票数 3
2
回答
如何在
Dataproc
中配置Druid?
、
既然Druid已成为Google ()
的
可选组件,我想知道如何从
Dataproc
集群创建Druid配置?我尝试了以下gcloud命令:num-masters=1 --num-workers=2 --optional-components=
ZOOKEEPER
,DRUID -- properties=druid:druid.storage.type=google但是它
浏览 6
提问于2020-08-03
得票数 2
1
回答
是否可以在云平台上部署HBase组件
、
、
、
可以在云平台中部署HBase组件。如果是,如何管理ACL?
浏览 9
提问于2021-03-23
得票数 0
回答已采纳
1
回答
Spark HBase到Google
Dataproc
和Bigtable
的
迁移
、
、
、
我在AWS EMR集群
上
运行了HBase Spark作业。最近我们搬到了GCP。我把所有的HBase数据都传输给了BigTable。现在,我在
Dataproc
中运行相同
的
Spark - Java/Scala作业。Spark作业失败,因为它正在查看spark.hbase.
zookeeper
.quorum设置。请让我知道,如何在不更改代码
的
情况下,让我
的
spark作业在BigTable上成功运行。 你好,Neeraj Verma
浏览 2
提问于2018-05-27
得票数 0
1
回答
使用气流运算符创建
dataproc
时无法连接到dpms
、
、
、
、
我为
dataproc
亚稳态(与composer
的
项目相同)创建了一个服务,并试图使用它而不是我
的
蜂巢仓库。命令成功地运行这个命令,但是当我尝试使用任何气流运算符(如DataprocClusterCreateOperator或DataprocCreateClusterOperator)时,我无法将这个外部dpms传递给我
的
dataproc
我看到它接受了一些参数,比如'
dataproc
_metastore_service‘,没有任何语法错误,但是它实际
上
并没有使用
浏览 10
提问于2022-06-28
得票数 0
回答已采纳
4
回答
Google
Dataproc
支持Apache Impala吗?
、
、
我刚开始使用云服务,在谷歌
的
云平台上导航是非常可怕
的
。当涉及到Google
Dataproc
时,他们确实在宣传Hadoop、Spark和Hive。 我
的
问题是,Impala到底有没有?
浏览 1
提问于2019-05-31
得票数 2
1
回答
非tls
上
的
Strimzi主题授权异常
、
、
在端口9094
上
启用了LoadBalancer,而没有TLS。apiVersion: kafka.strimzi.io/v1beta2metadata: logging: #9 loggers: kafka
浏览 7
提问于2022-01-31
得票数 0
回答已采纳
2
回答
composer工作流在
dataproc
运算符处失败
、
、
',submit_pyspark.set_upstream(simple_bash) 这是我
的
dataprocjob.pyprojct.dataset.txn_w_ah_demo"df.printSchema() 我
的
composer管道在<em
浏览 37
提问于2020-09-24
得票数 2
2
回答
无法从'google.cloud‘导入名称'
dataproc
_v1’(未知位置)
、
、
、
、
尝试通过Jupyter Notebook使用
Dataproc
从计算机进行访问时,我使用pip安装了所需
的
库。但是,在导入时出现错误 import google.cloud.
dataproc
_v1 错误信息如下: ModuleNotFoundError Traceback(most recent call last)----> 1 import google.cloud.
da
浏览 21
提问于2020-09-11
得票数 1
1
回答
AttributeError试图加载带有DataProcSparkOperator任务
的
DAG
、
、
、
我编写了一个DAG来在
DataProc
集群
上
执行许多spark任务。这个DAG过去一直工作没有改变,但后来我不得不删除和重新安装气流。现在,当启动when服务器时,我会收到以下错误: task_id = 'run_spark_job',
浏览 0
提问于2019-08-29
得票数 4
回答已采纳
1
回答
未授权在使用工作负载标识时充当服务帐户
的
用户
、
我们正在GKE
上
运行一个名为Airflow ()
的
开源产品。在这个吊舱中运行
的
进程需要与GCP
的
Dataproc
服务进行交互,以便创建
Dataproc
集群。我们使用运行我们
的
GKE应用程序。Kubernetes服务帐户(KSA)已在Google帐户
上
被授予roles/iam.workloadIdentityUser资源static11-dp-airf@mygcpproject.iam.gserviceaccount.com"
浏览 3
提问于2020-09-17
得票数 1
回答已采纳
1
回答
Google
Dataproc
Presto:如何使用Python运行查询
、
、
、
、
通过执行此中
的
步骤,我已经设置了一个运行Presto
的
Google
Dataproc
集群。 它工作得很好,我可以通过gcloud命令行工具运行查询,如链接所示。有没有办法通过我
的
Python应用程序在
Dataproc
集群
上
运行查询?我知道有适用于Presto
的
Python客户端,但我找不到有关如何将其与运行在
Dataproc
集群
上
的
Presto连接
的
资源。类似地,有一个Python库可以向
D
浏览 13
提问于2021-03-14
得票数 3
1
回答
我们在哪里可以看到GCP控制台中每个
dataproc
集群
的
计费细节或成本细节?
、
、
、
我想通过拥有多个机器类型来分析每个
Dataproc
集群
的
实际成本,但是我看不到任何选项来获取GCP项目中单个
dataproc
集群
的
成本细节,在GCP控制台中,我们可以看到每个
dataproc
集群
的
计费细节或成本细节吗
浏览 15
提问于2022-11-27
得票数 0
1
回答
Bigtable是否通过网络向
Dataproc
发送数据以执行映射阶段?
、
是通过网络将数据从Bigtable发送到
Dataproc
集群以执行映射阶段,还是映射阶段在Bigtable集群
上
物理运行?
浏览 3
提问于2016-12-06
得票数 1
回答已采纳
1
回答
如何使用气流下载数据记录到?
、
、
、
目前,我们要求通过气流在
Dataproc
上
运行火花作业。 我们能够通过气流在
Dataproc
上
运行Spark,并能够在GCP控制台上检查日志。但是想知道是否有一种方法可以从气流中获取
Dataproc
作业id并将
Dataproc
作业日志下载到GCS桶中?
浏览 5
提问于2022-03-09
得票数 2
1
回答
如何使PySpark在集群上工作
、
、
、
我有一系列问题(很抱歉,Google文档太糟糕了,而且不方便用户使用): 我已将gcs
浏览 3
提问于2019-01-18
得票数 3
1
回答
与
Dataproc
集群
的
色调集成
、
、
是否存在将色调与
dataproc
集群集成
的
方法?
浏览 0
提问于2020-02-13
得票数 3
回答已采纳
1
回答
在齐柏林飞艇
上
使用数据进程加载插件GitHubNotebookRepo和GCSNotebookRepo时出现
的
问题
、
、
我尝试在GCS和GitHub
上
保存我
的
笔记本,但没有成功。
浏览 3
提问于2020-07-24
得票数 1
2
回答
Dataproc
群集
的
数据融合资源调配失败
、
我已经创建了一个简单
的
管道,它从SQL Server表中读取数据,然后写入到BigQuery表中。然后,我将其配置为使用Spark并部署和运行。它从提供
dataproc
集群开始,我可以看到它相对较快地创建了3个VM,一个master和两个worker。不过,在
dataproc
UI和Data Fusion UI中,主要
的
集群创建作业仍然是"provisioning“。大约17分钟后,它失败了。 我在一个企业实例和一个基本实例中都尝试过。06-21 10:59:42,087 - INFO [provisionin
浏览 26
提问于2019-06-21
得票数 3
回答已采纳
点击加载更多
相关
资讯
zookeeper的架构
Zookeeper的配置
浅谈zookeeper性能的优缺点
浅谈Zookeeper的应用场景
简单的Kafka:没有ZooKeeper的Kafka
热门
标签
更多标签
云服务器
对象存储
ICP备案
云点播
实时音视频
活动推荐
运营活动
广告
关闭
领券