腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
我
可以
使用
Cloud
Dataproc
Python
API
从
我
的
本地
系统
上传
Jar
吗
?
、
在Google
Cloud
命令行CLI运行
的
情况下,您
可以
使用
--jars标志指定
本地
jar
。但是,
我
想
使用
Python
API
提交一个作业。
我
让它正常工作,但是当我指定
jar
时,如果
我
使用
file:前缀,它将在
Dataproc
主集群上查看,而不是在
我
的
本地
工作站上。有一个简
浏览 10
提问于2021-02-26
得票数 2
回答已采纳
1
回答
气流DataprocSubmitJobOperator - ValueError:协议消息作业没有"
python
_file_uris“字段
、
、
、
、
我
正在
使用
气流中
的
DataprocSubmitJobOperator来安排火花放电作业,而且当我无法将pyfiles传递给火花放电作业时达格 # working - passing,
我
将move2mongo_
api
.zip
上传
到存储桶( gs://dagger-mongo/move2mongo_
api
.zip)。当我运行这个工作流时,
我
得到<em
浏览 10
提问于2022-07-17
得票数 1
回答已采纳
1
回答
Dataproc
通过
Python
客户端提交Hadoop作业
、
、
、
我
试图通过将gcloud命令转换为
API
来
使用
Dataproc
,但是
我
在文档中找不到一个很好
的
例子。%pip install google-
cloud
-
dataproc
from google.
cloud
import
dataproc
_v1
我
需要将以下gcloud命令转换为
Python<
浏览 0
提问于2019-04-08
得票数 1
回答已采纳
1
回答
GCP
Dataproc
基础Docker镜像
、
、
谁知道
我
在哪里
可以
找到GCP
的
数据处理程序
的
docker镜像?
我
使用
过
dataproc
集群,发现它们相当不错,但我想在
本地
开发,只有在
我
准备好处理大型工作时才将我
的
计算转移到云上。
我
已经找到了一些
可以
与pyspark一起工作
的
docker图像,但我想得到一些像GCP
dataproc
一样流畅
的
东西。
浏览 27
提问于2021-10-13
得票数 0
回答已采纳
2
回答
NoSuchMethodError StorageObject.getTimeCreated在
Dataproc
中运行作业
、
我
在试着做一份在当地工作
的
火花作业。它
使用
谷歌存储。()Lcom/google/
api
/client/util/DateTime; at com.google.
cloud
.storage.BlobInfo.fromPb(BlobInfo.java
Dataproc
作业
使用
gcloud-java-storage-0.2.8.
jar
,尽管定义了该方法,但我尝试了google-
api
-
浏览 3
提问于2016-09-14
得票数 2
回答已采纳
1
回答
Mrjob无法在
dataproc
上创建集群:__init__()获得意外
的
关键字参数'channel‘
、
、
、
、
我
正在尝试
使用
Python
mrjob库在Google
Cloud
Dataproc
上运行Hadoop Map Reduce字数计算示例。Google
Cloud
上启用了
API
,并为服务帐户设置了所有必需
的
角色。mrjob成功地将文件
上传
到谷歌云存储。但是一旦它试图创建一个新
的
Dataproc
集群就失败了。 可能会出什么问题呢?在
Dataproc
上启动mrjob
的
浏览 36
提问于2020-11-01
得票数 2
1
回答
来自
DataProc
集群
的
Google
Cloud
Sdk
、
、
从
google-
dataproc
集群
使用
/安装
python
google云
api
的
正确方式是什么?例如,如果
我
在集群上
使用
zeppelin/pyspark,并且
我
想
使用
pub-sub
api
,
我
应该如何准备它?
我
不清楚在默认集群配置期间安装了什么和没有安装什么,也不清楚
我
是否应该/如何尝试为google
cl
浏览 2
提问于2016-03-26
得票数 0
2
回答
使用
dataproc
hadoop集群和气流将数据
从
google云存储转移到S3
、
、
、
、
我
正在尝试将大量数据
从
GCS传输到S3桶。
我
使用
Google
DataProc
构建了一个hadoop集群。]@aws-bucket/folder
dataproc
_hadoop_jars=None,
浏览 7
提问于2018-01-11
得票数 0
回答已采纳
2
回答
无法
从
'google.
cloud
‘导入名称'
dataproc
_v1’(未知位置)
、
、
、
、
尝试通过Jupyter Notebook
使用
Dataproc
从
计算机进行访问时,
我
使用
pip安装了所需
的
库。但是,在导入时出现错误 import google.
cloud
.
dataproc
_v1 错误信息如下: ModuleNotFoundError Traceback(most recent call last) <ipython-input-3-fc8862c62c75> in <mod
浏览 21
提问于2020-09-11
得票数 1
1
回答
如何在向hadoop提交远程应用程序时设置
jar
路径?
、
、
我
试着在网站上运行第一个示例 Path jarPath = new Path("target/HadoopStudy-0.0.1-SNAPSHOT.
jar
"); FileSystem并将应用程序提交给纱线,但是应用程序总是失败
的
,
我
在主机上查看了nodemanger日志,
我
发现了这些错误。PC A上运行这个例子,但是
我
在PC B上部署hadoop,
jar
在PC A上。经过调
浏览 3
提问于2013-11-08
得票数 1
回答已采纳
2
回答
创建
dataproc
集群时DataNodes报告数量不足
、
、
在
使用
gs://作为默认文件
系统
创建
dataproc
集群时,
我
收到“DataNodes reporting
的
数量不足”错误。下面是
我
正在
使用
的
dataproc
cluster命令。gcloud
dataproc
clusters create cluster-538f --image-version 1.2 \ --bucket
dataproc
_bucket_testw
浏览 16
提问于2018-09-10
得票数 0
3
回答
google-
cloud
-vision如何读取pdf文件
我
正在
使用
谷歌OCR
API
,
我
正在阅读图像和PDF文件,
我
能够读取和处理图像文件,但是,对于PDF文件,根据,他们已经提到,我们需要将我们
的
文档存储到谷歌云服务。话虽如此,由于数据
的
保密性,
我
不能将我
的
数据存储到Google
Cloud
中,
我
想从
我
的
本地
系统
上传
我
的
PDF,
浏览 7
提问于2018-08-24
得票数 6
2
回答
google
dataproc
- image版本2.0.x如何将pyspark版本降级到3.0.1
、
、
、
在google云中
使用
dataproc
镜像版本2.0.x,因为在这个
dataproc
镜像版本中提供了delta0.7.0。然而,这个
dataproc
实例附带了pyspark 3.1.1
的
默认版本,Apache Spark 3.1.1还没有正式发布。因此,没有与3.1兼容
的
Delta Lake版本,因此建议降级。
我
已经尝试了下面的方法,在
dataproc
实例<e
浏览 1
提问于2021-02-09
得票数 1
2
回答
将数据
从
Dataproc
保存到数据存储区
、
、
、
我
已经在Google
Dataproc
/ Spark中
使用
Python
2.7实现了一个推荐引擎,需要将输出作为记录存储在Datastore中,以便随后由App engine
API
使用
。然而,似乎没有一种方法
可以
直接做到这一点。 据我所知,目前还没有用于
Dataproc
的
Python
Datastore连接器。
Python
Dataflow SDK不支持写入Datastore (尽管Jav
浏览 2
提问于2016-11-10
得票数 0
1
回答
将类型安全配置配置文件传递到DataProcSparkOperator
、
、
、
、
我
正在
使用
Google
dataproc
提交spark作业,并
使用
google
cloud
composer来安排它们。不幸
的
是,
我
正面临着困难。
我
依靠.conf文件(类型安全配置文件)将参数传递给我
的
spark作业。
我
对airflow数据过程
使用
了以下
python
代码:
浏览 0
提问于2018-09-15
得票数 3
3
回答
如何基于预览版本创建自定义
的
dataproc
映像
、
我
试图在GCP中创建一个自定义
Dataproc
映像。它
可以
很好地处理处于稳定发布状态
的
基本映像(例如1.3.24)。但是,如果
我
指定了预览中
的
基本图像(例如1.4.0),则会收到以下错误消息: 1.4
我
得到了RuntimeError: ('Cannot find
dataproc
base image
浏览 1
提问于2019-02-20
得票数 0
回答已采纳
1
回答
如何在Google
Dataproc
集群中安装和运行pip
、
、
、
我
使用
以下命令在谷歌
DataProc
中创建了一个集群: gcloud beta
dataproc
clusters create my-cluster \ --project my-project \中添加gs://goog-
dataproc
-initialization-actions-${REGION}/
python
/pip-install.sh,链接如下:
Dataproc
python
configurat
浏览 10
提问于2020-01-29
得票数 2
回答已采纳
1
回答
通过sqoop连接时,MySql中
的
用户访问被拒绝
、
、
、
出于自学
的
目的,
我
正在尝试在Google云中创建端到端数据流:
我
在通过sqoop访问mysql表时遇到了麻烦。
我
尝试通过以下方式解决此问题:1.将
本地
主机替换为公网ip。.* TO test@'<ip>' IDENTIFIED B
浏览 26
提问于2020-03-06
得票数 0
2
回答
Dataproc
试图通过JDBC连接到Postgres,缺少权限
、
、
、
、
我
希望
使用
JDBC将其连接/写入到
使用
Cloud
编程运行
的
Postgres SQL实例。
我
使用
了以下jars: 2019-
浏览 0
提问于2019-04-01
得票数 2
回答已采纳
1
回答
如何摆脱grpc中对CallCredentials2
的
调用
、
、
、
我
正在为一个类项目编写一些代码,该类项目将作业发送到GCP中
的
dataproc
集群。
我
最近遇到了一个奇怪
的
错误,
我
很难把头绕在上面。:67)at com.google.
cloud
.
dataproc
.v1
我
必须为
我
的
项目更改一个依赖项,以便它
浏览 14
提问于2021-11-27
得票数 3
回答已采纳
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券