腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(5743)
视频
沙龙
2
回答
阿帕奇
光束
到
BigQuery
、
、
、
、
我正在Google Cloud Dataflow中构建一个流程,该流程将使用发布/订阅中
的
消息,并基于一个键
的
值将它们写入BQ或GCS。我能够拆分消息,但我不确定如何将数据写入
BigQuery
。我
的
完整代码如下: https://pastebin.com/4W9Vu4Km 基本上我
的
问题是,我不知道如何在 (第73行)变量 应该写入BQ。这可能是因为我给它提供
的
不是字典,而是字典列表(我想使用1分钟窗口)。 有什么想法吗?(另外,如果代码中有一些太
浏览 102
提问于2021-02-23
得票数 1
回答已采纳
1
回答
Apache依赖关系错误
、
、
、
、
我正在尝试使用来自Java
的
Apache作为数据管道。我编写了一个简单
的
类,它来自Google并深入
到
,但我无法让它为我
的
生命构建。我使用Maven构建并添加了我能找到
的
每一个束包,但是我仍然会得到“类文件未找到”错误。不幸
的
是,谷歌一直没有提供任何帮助。 我所拥有的POM文件是基于Apache为Wordcount提供
的
示例POM,但是添加了额外
的
依赖项。下面是我输入
的
依赖项。我可以提供完整
的
文件,如果需要,但它是相
浏览 0
提问于2018-02-12
得票数 2
回答已采纳
1
回答
到外部数据存储
的
Apache stores偏移量管理
、
、
、
我正在尝试阅读多个卡夫卡经纪人使用KafkaIO上
的
阿帕奇
光束
。偏移量管理
的
默认选项是kafka分区本身(不再使用kafka >0.9
的
zookeper )。使用此设置时,当我重新启动作业/管道时,存在重复和缺少记录
的
问题。读完卡夫卡之后,我会把
浏览 9
提问于2017-12-24
得票数 0
2
回答
如何实现动态BigQueryIO输入
、
、
我正在使用谷歌数据流上
的
阿帕奇
光束
。 我
的
流水线从
BigQuery
读取数据,但它依赖于执行参数。我应该能够用一个点(经度,纬度)和几个点来运行管道。我尝试在每个点上应用
BigQuery
read,并将结果合并到一个PCollection中,但我不知道如何将点传递
到
管道并动态构建它。
浏览 16
提问于2019-01-27
得票数 0
回答已采纳
3
回答
阿帕奇
光束
数据流
BigQuery
、
、
、
如何使用apache和DataflowRunner从Google
BigQuery
数据集中获取表
的
列表? 我找不到如何从指定
的
数据集中获取表。我想使用Dataflow
的
并行处理编程模型将表从位于美国
的
数据集迁移到位于欧盟
的
数据集。
浏览 0
提问于2018-07-16
得票数 0
2
回答
如何在apache beam数据流中将csv转换为字典
、
、
、
、
我想读取一个csv文件,并将其写入
到
BigQuery
使用
阿帕奇
光束
数据流。为此,我需要将数据以字典
的
形式呈现给
BigQuery
。如何使用apache beam转换数据以实现此目的?我
的
输入csv文件有两列,我想在
BigQuery
中创建一个后续
的
两列
的
表。我知道如何在
BigQuery
中创建数据,这很简单,我不知道
的
是如何将csv转换成字典。下面的代码是不正确
的
,但应
浏览 1
提问于2016-12-16
得票数 9
回答已采纳
1
回答
如果我们可以直接使用Apache spark,为什么还要使用Apache beam spark runner?
、
、
我在读关于
阿帕奇
光束
的
文章。在
阿帕奇
光束
中经历了各种跑步者。但我想知道,如果有人可以直接使用apache spark,为什么要使用带有spark runner
的
apache beam?
浏览 2
提问于2020-06-30
得票数 1
1
回答
数据流从主题PubSub读取并写入
Bigquery
(多个表)
、
、
、
有人在数据流中使用过DynamicDestination,他有一个简单且描述过
的
示例。我厌倦了在git (<code>C0</code>)中看到远程传送
的
例子,它伤害了我作为一个新手在
阿帕奇
光束
。顺便说一下,我需要做
的
是从Pubsub读取消息,并通过数据流作业写入
BigQuery
dataset中
的
不同目的地(表)。我有一个自定义项目,它非常适合
Bigquery
表,但Pubsub主题将包含来自同一数据集
的</e
浏览 15
提问于2020-03-18
得票数 2
1
回答
需要为初学者提供Apache_beam学习材料
的
建议
我需要学习一个项目的
阿帕奇
光束
。我已经阅读了Apache
光束
文档,但我认为这还不够。有没有人可以推荐学习Apache
光束
的
资源?
浏览 10
提问于2017-07-04
得票数 0
回答已采纳
2
回答
Google Cloud Platform Data ETL批量处理:云函数数据流
、
、
、
我在我
的
新公司担任数据工程师,致力于构建google cloud platform (GCP)批处理ETL管道。我
的
团队
的
数据科学家最近向我传递了一个数据模型(用Python3.6编写
的
.py文件)。 数据模型有一个主函数,我可以调用它并获得一个数据帧作为输出,我打算将这个数据帧附加到一个
bigquery
表中。有没有什么办法,我可以只导入这个主函数,并使用apache (数据流)将其集成
到
管道中,而不必将数据模型重新编码为PTransform?或者,使用云调度程序和云函数来实现我想要<e
浏览 0
提问于2019-08-21
得票数 0
1
回答
如何为apache
光束
管道配置spark runner for java
、
、
我是新手
阿帕奇
光束
和太空火花,我想配置火花流道
的
光束
管道。文档中提到
的
内容我不清楚。
浏览 1
提问于2020-04-18
得票数 0
1
回答
如何使用
BigQuery
存储读取API定义Apache Beam中
的
最大流数
、
、
、
我想从
BigQuery
中读取数据并将其发布
到
Pubsub。为此,我想使用Apache
光束
,并在数据流中运行此管道。而且我
的
BQ查询需要很长时间才能执行。因此,希望使用
BigQuery
的
Storage Read API来减少这一时间,该API支持使用流读取数据。尽管Beam支持使用存储API,但我找不到设置最大流数
的
文档。谁能帮助我如何设置从
BigQuery
读取数据
的
Apache
光束
管道中
的
流
浏览 25
提问于2021-05-02
得票数 0
2
回答
我可以在原生python中使用google DataFlow吗?
、
、
、
我正试图在google中构建python管道,而google云数据流似乎是一个不错
的
选择。当我研究文档和开发人员指南时,我发现apache梁总是附在数据流上,因为它是基于它
的
。我可能会在apache beam中找到处理我
的
数据文件
的
问题。 如果我想用DataFlow在原生python中构建我
的
ETL脚本,这可能吗?还是有必要用
阿帕奇
光束
进行ETL?如果DataFlow仅仅是为了使用Apache而构建
的
呢?是否有无服务
浏览 4
提问于2021-08-23
得票数 1
1
回答
将BigTable中
的
checkAndMutate (条件写入)与Apache Beam结合使用
、
、
、
我需要写记录到BigTable使用
阿帕奇
光束
。但是,如果表中已经存在特定
的
行键,则不能写入该记录。我可以在BigTable中使用条件写来做这件事吗?我在文档中没有找到与Apache
光束
相关
的
示例。
浏览 45
提问于2019-12-21
得票数 1
1
回答
使用Google云数据流生成xml文件
、
、
我正在进行一个项目,以生成包含将显示在Google上
的
数据
的
xml文件。是否可以使用Google生成xml文件?
浏览 1
提问于2017-11-03
得票数 0
回答已采纳
1
回答
数据摄取-使用并发进行大规模并行处理
、
、
、
我正在寻找一个具有并发
的
大规模并行处理系统,它可以为每500毫秒100多万台IoT设备提供无缝
的
数据摄取解决方案。寻找开源
的
、高度可扩展
的
、不同协议
的
丰富
的
库,支持ESB,并且可以无故障地管理多线程。 是
阿帕奇
光束
,
阿帕奇
Nifi或
阿帕奇
骆驼或WSO2更好
的
选择。
浏览 2
提问于2018-07-30
得票数 0
1
回答
光束
:每个窗口元素有窗口边界
的
书写
、
、
、
对于一个简单
的
概念证明,我试图在两分钟
的
窗口中窗口点击数据。我想要做
的
就是打印每个窗口
的
计数,以及窗口
的
边界
到
BigQuery
。,"reason":"invalid"}],"index":0}]// Creating the pipeline Pipeline p = Pipeline.create(optionswithoutDefaults())
浏览 1
提问于2018-11-26
得票数 0
回答已采纳
1
回答
哪些运行器支持apache中
的
kafkaIO?
、
、
、
我正在与
阿帕奇
光束
一起工作。我
的
任务是从kafka主题中提取数据,并在数据流中进行处理。数据流是否支持kafkaIO? KafkaIO支持哪些runners?
浏览 0
提问于2020-07-08
得票数 2
1
回答
Apache beam
BigQuery
视图
、
在GCP
BigQuery
中,可以创建表
的
视图。文档在这里:https://cloud.google.com/
bigquery
/docs/views。我想知道是否有可能通过Apache
光束
在
BigQuery
中创建一个视图,如果可以,它不在文档https://beam.apache.org/documentation/io/built-in/google-
bigquery
浏览 9
提问于2021-08-20
得票数 0
1
回答
使用带锈蚀
的
Apache梁
、
我们所有的服务代码都是用铁锈写
的
。为了防止训练服务偏差,我们希望在使用Apache
的
批处理过程中使用相同
的
服务代码。在
阿帕奇
光束
中使用锈菌有什么指示吗?
浏览 4
提问于2022-10-09
得票数 3
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
即时通信 IM
实时音视频
活动推荐
运营活动
广告
关闭
领券