腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
具有
多个
Python
依赖
项
的
模板
DataFlow
、
、
、
我正在尝试用
Python
语言从
具有
多个
文件
依赖
关系
的
管道中创建一个
模板
DataFlow
。functions.py在文件main.py中,有一个导入行:我
的
setup.py文件包含(按照建议
的
): package_dir={'': ''},
浏览 29
提问于2021-03-03
得票数 1
2
回答
是否可以在不
具有
本地所有
依赖
项
的
情况下运行/序列化数据流作业?
、
、
我已经使用Apache光束为Google Cloud
Dataflow
创建了一个管道,但我不能在本地拥有
Python
依赖
项
。但是,远程安装这些
依赖
项
是没有问题
的
。在我
的
本地(开发)环境中,有没有可能在不执行
Python
代码
的
情况下运行作业或创建
模板
?
浏览 1
提问于2019-09-27
得票数 0
4
回答
在
Dataflow
Python
flex
模板
中包含另一个文件ImportError
、
、
、
有没有一个包含
多个
文件
的
Python
Dataflow
Flex
模板
的
示例,其中脚本正在导入同一文件夹中包含
的
其他文件?flex
模板
在main.py中导入custom.py。Dockerfile示例: ARG WORKDIR=/
dataflow<
浏览 0
提问于2020-11-18
得票数 6
1
回答
数据流flex
模板
作业尝试使用相同
的
job_name启动第二个作业(用于管道)
我正在尝试启动一个
Dataflow
flex
模板
。作为构建和部署过程
的
一部分,我正在预构建一个自定义SDK容器映像,以减少工人启动时间。当给定一个数据流时(预先安装了
依赖
项
),数据流作业就会启动,但是它不会在同一个作业上运行管道,而是尝试使用相同
的
名称为管道启动一个数据流作业,这会导致error.Errors:重复
的
数据流作业名DataflowJobAlreadyExistsError如果我试图为管道传递第二个job_name,管道成功地在一个单独
的
作
浏览 15
提问于2022-10-18
得票数 1
1
回答
使用Bazel (使用DataflowRunner)建造梁管道
、
、
我用Bazel建造了我
的
束流管道。该管道在使用DirectRunner时运行良好,但是,当我使用DataflowRunner时,我在管理
依赖
关系方面遇到了一些困难,DataflowRunner无法在DataflowRunner中找到本地
依赖
项
(例如py_library生成
的
依赖
项
)。有没有任何方法提示
Dataflow
使用工作者容器中
的
python
文件(py_binray zip文件)来解决这个问题? 谢谢,
浏览 3
提问于2022-04-01
得票数 1
1
回答
使用花朵数据集进行图像分类
的
示例
、
、
、
、
但是,当我输入以下行时:
python
trainer/preprocess.py \ --input_dict "$DICT_FILE“\ --input_path "gs://cloud-ml-data
浏览 0
提问于2018-02-19
得票数 0
2
回答
Google可以在没有许可
的
情况下写到任何地方
、
我创建了一个服务帐户,并将
Dataflow
developer角色、Compute角色和角色分配给临时桶。最后,我提交了一个
具有
以下cmd
的
数据流作业:TMPBUCKET=temporarybucketOUTBUCKET=outputbucket --input
浏览 1
提问于2020-01-06
得票数 0
2
回答
Java应用程序中
的
Maven冲突与google核心-grpc
依赖
关系
、
、
、
、
(我还提出了一个GitHub问题- )
依赖
1- google-cloud-
dataflow
-java-sdk-all <dependenc
浏览 0
提问于2018-11-22
得票数 7
2
回答
Apache梁
DataFlow
转轮抛出设置错误
、
、
我们正在使用构建数据管道,并试图在
Dataflow
上运行,但是得到以下错误,我们尝试增加内存大小、工作人员数量等,但仍然得到相同
的
错误。这是我们使用
的
命令,--project=xyz \--staging_location=gs://xy
浏览 0
提问于2018-03-23
得票数 4
回答已采纳
1
回答
我们是否因为谷歌云端数据流作业
的
放置位置而被收费?
需要为我
的
数据流工作存储临时文件
的
暂存位置。 到目前为止,我们一直在执行作业,这不需要太多
的
第三方作业。现在,我们希望执行一个
具有
许多第三方
依赖
项
的
作业。因此,在运行作业时上传
的
文件会增加。在每个作业执行
的
暂存位置中,
Dataflow
是否有
多个
jar副本?
浏览 2
提问于2015-08-13
得票数 2
回答已采纳
3
回答
从google cloud composer运行
Dataflow
时出现
的
导入
依赖
项
问题
、
、
、
、
我正在从google cloud composer运行
Dataflow
,该
dataflow
脚本包含一些非标准
依赖
项
,如zeep、googleads。因此,我创建了pythonvirtualenvoperator,并安装了所有需要
的
非标准
依赖
项
,并尝试运行数据流作业,但它仍然抱怨导入zeep和googleads。下面是我
的
代码库: task_id=PROCESS_TASK
浏览 0
提问于2019-03-05
得票数 1
1
回答
数据流无法使用自定义
模板
解析
模板
文件
、
我正在尝试在数据流中运行一个简单
的
管道 import apache_beam as beam gcloud_options.temp_location = 'gs://xxxx/temp' gcloud_options.service_account_email = '
dataflow
= beam.Pipeline(options=opti
浏览 12
提问于2019-09-03
得票数 0
回答已采纳
1
回答
数据流ReadFromMongoDB失败,出现
依赖
关系错误
、
、
、
、
我
的
数据流流水线如下: | ReadFromMongoDB(uri='mongodb+srv://mongo_url',db='db_name',coll='column_name| "WriteMyFile" >> beam.io.WriteToText('gs://bucket_name/file123.json') 我
的
数据流管道失败pym
浏览 1
提问于2021-02-03
得票数 1
1
回答
从迁移到Apache
、
、
、
我是Google
的
Mapreduce库
的
长期用户,用于处理Google中
的
数据。Google不再支持它,它在
Python
3中根本不起作用。我试图将我们以前
的
Mapreduce作业迁移到Google
的
Dataflow
/ Apache,但是很糟糕,它只是描述Apache,它没有告诉您如何迁移。然而,在Beam中,您必须创建和部署一个定制
的
Docker映像来构建
Dataflow
环境,对吗? 要在Mapreduce中创建一个新
浏览 4
提问于2021-01-16
得票数 0
1
回答
GCP Flex
模板
错误:在envsetup中未设置py选项.等待容器错误:意外EOF
、
、
Attempint使用
具有
自定义
python
容器映像
的
dataflow
flex
模板
运行程序。FROM gcr.io/
dataflow
-templates-base/
python
3-template-launcher-base RUNENV FLEX_TEMPLATE_
PYTHON
_REQUIREMENTS_FILE="$
浏览 4
提问于2021-10-04
得票数 1
1
回答
在管道选项中提供sdk_location
、
然后我添加了sdk_location={ .tar.gz文件
的
位置}安装员工包失败。 还有其他人有这个问题吗?这就是应该提供
的
球吗?
浏览 12
提问于2022-04-29
得票数 0
1
回答
数据流PubSub到弹性搜索
模板
代理
、
、
、
我们需要创建一个从PubSub到Elasticsearch
的
数据流作业,但是该作业不能使出站互联网连接到Elastic。 谢谢
浏览 16
提问于2022-08-04
得票数 1
回答已采纳
1
回答
从云函数触发数据流作业
的
问题: ModuleNotFoundError:没有名为“functions_framework”
的
模块
、
、
、
虽然这个
Dataflow
作业在没有云函数
的
情况下工作得很好,但是Cloud做了一些其他
的
事情。它正确地记录文件详细信息,它会触发一个数据流作业,但是如果出现“模块未找到”错误,则
Dataflow
就会失败。因此,当函数正确地执行和触发作业时,
Dataflow
作业不会通过。input_file) | beam.io.WriteToText(output_path, file_name_suffix='.txt')) 我还在与函数相同
的<
浏览 7
提问于2022-06-12
得票数 0
回答已采纳
1
回答
更新apach梁数据流和google云-bigquery
的
指南
、
、
、
、
我想使用最新
的
google bigquery和
dataflow
sdk,它可用于
python
2.7。我
的
管道设置如下:*setup(** version/setup.py" 环境:数据流视图上
的
SDK版本显示了2.
浏览 1
提问于2019-11-19
得票数 0
2
回答
数据流flex
模板
: ModuleNotFoundError:没有模块名
、
我
的
Python
包有以下结构,其中beam.py是
Dataflow
的
入口点脚本: __init__.py __init__.pyFROM gcr.io/
dataflow
-templates-base/
python
3-template-launcher-base:latest &a
浏览 8
提问于2021-12-13
得票数 0
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券