腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
谷歌
云
数据流
(
Apache
光束
)-
我
可以
在
TextIO.write
中
使用
SideInputs
吗
?
、
到目前为止,我们只能对DoFn
使用
sideInputs
,以便在处理每一个输入行时
使用
侧边输入。 outputTuple.get(deadletterTag)
TextIO.write
.withSuffix(".csv&quo
浏览 9
提问于2017-08-12
得票数 0
回答已采纳
1
回答
从Google cloud
数据流
收集应用程序指标
、
在
谷歌
云
数据流
/
光束
中
,我们
可以
使用
这个Metrics API收集应用程序指标,并且
可以
使用
另一个API
在
应用程序
中
查询它。但我需要将这些指标持久化到Bigquery/Prometheus
中
,以实现实时监控和警报机制。请建议如何在
谷歌
云
数据流
中
实现这一点。
浏览 33
提问于2020-01-14
得票数 0
回答已采纳
1
回答
在
阿里巴巴
云
上部署
Apache
Beam管道
、
、
我
是阿里巴巴
云
的新手,
我
有一个运行在Google Cloud Dataflow上的
Apache
光束
应用程序。现在,
我
想将相同的
apache
beam管道部署到阿里
云
。
我
正在寻求关于如何/需要哪些设置才能在阿里云中运行
apache
beam管道的帮助?阿里巴巴有没有相当于Google Cloud Platform Dataflow的资源?
浏览 2
提问于2020-03-25
得票数 0
1
回答
带有
Apache
横梁的弹簧
、
、
我
想
使用
Spring与
Apache
光束
,这将运行在
谷歌
云
数据流
运行。
数据流
作业应该能够
在
执行管道步骤时
使用
Spring Runtime应用程序上下文。
我
想在
我
的
Apache
光束
管道中
使用
Spring特性来实现DI和其他东西。
在
google上浏览了几个小时后,
我
找不到任何关于
在
浏览 9
提问于2019-10-05
得票数 2
1
回答
为什么
在
Scio
中
你更喜欢聚合而不是groupByKey?
、
、
、
发自: 尤其是为什么人们更喜欢聚合而不是groupByKey呢?
浏览 1
提问于2018-05-11
得票数 1
回答已采纳
2
回答
google-cloud-dataflow vs
apache
-
apache
、
令人困惑的是,每个关于
数据流
的
谷歌
文档都说它现在是基于
Apache
光束
的,并将我引导到
光束
网站。此外,如果
我
查找github项目,我会发现google dataflow项目是空的,并且所有的项目都转到
apache
see repo。假设
我
现在需要创建一个管道,根据我从
Apache
光束
中
读到的,我会这样做:from
apache
_beam.options.pipeline_optio
浏览 1
提问于2017-06-16
得票数 3
2
回答
谷歌
数据流
-如果写入本地服务器,如何在java中指定TextIO?
、
、
、
谷歌
数据流
-如果从
数据流
写入本地服务器,如何指定TextIO?(前提是本地服务器通过
云
VPN连接到GCP )在运行
数据流
作业时,是否
可以
像上面那样提供本地IP和目录?
我
试过了,作业成功
浏览 2
提问于2018-09-14
得票数 0
2
回答
更改
谷歌
云
数据流
BigQuery优先级
、
、
我
有一个运行在从BigQuery读取数据的
谷歌
云
DataFlow上的Beam作业。当我运行作业时,作业需要几分钟时间才能开始从(微型)表
中
读取数据。结果是
数据流
作业发送的是以批处理模式运行而不是以交互模式运行的BigQuery作业。如何将其切换为
在
Apache
光束
中立即运行?
我
在
API
中
找不到更改优先级的方法。
浏览 2
提问于2017-05-26
得票数 1
2
回答
我
可以
在
原生python中
使用
google DataFlow
吗
?
、
、
、
我
正试图
在
google
中
构建python管道,而google
云
数据流
似乎是一个不错的选择。当我研究文档和开发人员指南时,
我
发现
apache
梁总是附在
数据流
上,因为它是基于它的。
我
可能会在
apache
beam中找到处理我的数据文件的问题。 如果
我
想用DataFlow
在
原生python
中
构建
我
的ETL脚本,这可能
浏览 4
提问于2021-08-23
得票数 1
1
回答
如何
使用
数据流
更新
云
IoT核心中的IoT设备配置?
、
、
、
我
正在
使用
谷歌
云
平台来收集IoT数据。然后进行分析,可能是
在
AI平台上,
我
想将一些检索到的数据作为配置设置发送到IoT设备。
我
已经看到了几个流程图(见下文),显示了数据如何通过
数据流
从AI平台流动到IoT核心作为设备配置,但我该如何做到这一点?(
我
之前仅通过Cloud Functions发送设备配置更新。) ?
我
是Dataflow和AI平台的新手,但已经开始考虑向Dataflow
中
的
浏览 19
提问于2020-06-11
得票数 0
回答已采纳
6
回答
Google Cloud Dataflow和Google Cloud Dataproc之间的区别是什么?
、
、
我
正在
使用
Google Data Flow来实现一个ETL数据仓库解决方案。而且看起来DataProc比DataFlow便宜一点。有没有人知道相对于DataProc,DataFlow的优缺点 为什么
谷歌
同时提供这两种服务?
浏览 1
提问于2017-09-27
得票数 66
1
回答
谷歌
IoT核心设备监控
使用
云
监控与大量设备?
、
、
、
我们有一个
使用
谷歌
IoT核心来管理设备的项目,我们想为设备创建一个监控系统。
我
想知道这是不是一个实用的可扩展的解决方案--
我
担心指标的数量对于Google监控来说
浏览 4
提问于2021-05-19
得票数 0
1
回答
数据流
中
的DirectPipelineRunner从本地计算机读取到
谷歌
云
存储
、
、
我
尝试运行
数据流
管道,从本地机器(Windows)读取数据,并
使用
DirectPipelineRunner将数据写入
谷歌
云
存储。作业失败,错误如下:指定FileNotFoundException(因此
我
认为
数据流
作业无法读取
我
的位置)。
我
从本地计算机运行该作业,以运行
我
创建的基于GCP的模板。
我
可以
在
GCP Dataflow仪表板中看到它,但失败并显示以下错误。请
浏览 4
提问于2018-08-10
得票数 1
1
回答
Apache
光束
不会将文件写入本地环境或Google存储
、
、
、
出于某种原因,
Apache
光束
不会将文件写入
我
的本地环境或Google Storage。
我
的目标是从
谷歌
PubSub读取数据,并将其批量写入
谷歌
存储。要做到这一点,
我
有以下代码: .apply(PubsubIO.readStrings()UpperCaseAndPrint())) .apply(Window.into(FixedWindows.of(Duration.mil
浏览 0
提问于2018-10-24
得票数 2
2
回答
Google Cloud Platform Data ETL批量处理:
云
函数
数据流
、
、
、
我
在
我
的新公司担任数据工程师,致力于构建google cloud platform (GCP)批处理ETL管道。
我
的团队的数据科学家最近向我传递了一个数据模型(用Python3.6编写的.py文件)。 数据模型有一个主函数,
我
可以
调用它并获得一个数据帧作为输出,
我
打算将这个数据帧附加到一个bigquery表
中
。有没有什么办法,
我
可以
只导入这个主函数,并
使用
apache
(
数
浏览 0
提问于2019-08-21
得票数 0
2
回答
从beam管道连接google cloud sql postgres实例
、
、
、
我
想连接
谷歌
云
sql postgres实例从运行在
谷歌
数据流
上的
apache
beam管道。
我
找不到与此相关的适当文档。
在
云
SQL
中
如何指导
我
看不到任何关于
数据流
的文档。 有人能提供文档链接/github示例
吗
?
浏览 1
提问于2017-11-06
得票数 3
1
回答
Google Cloud Storage Concurrency with Python /
Apache
Beam?
、
、
我
正在
使用
Python
中
的
Apache
光束
构建一个管道,并且
我
需要避免
在
Google Cloud Storage
中
写入文件时出现竞争条件。下面的链接介绍了如何通过gsutil
在
谷歌
云
存储中
使用
并发控制。 有没有人知道有没有办法用Python或
Apache
Beam Python SDK来完成同样的事情?
浏览 2
提问于2018-08-31
得票数 0
1
回答
除了google
云
数据流
之外,是否还有任何运行程序支持?
、
、
、
我
已经
使用
google
云
数据流
和
apache
构建了大约一年的python管道。
我
把
谷歌
的
云
环境留给了一个,它已经安装了火花。看起来火花运行器只适用于java ()
吗
?对于如何在
云
数据流
之外运行python管道,有什么建议
吗
?
浏览 0
提问于2018-03-13
得票数 0
回答已采纳
1
回答
数据流
写入GCS存储桶,但文件名
中
的时间戳未更改
、
、
、
、
我
有一个关于
Apache
光束
的问题,特别是关于
数据流
的问题。
我
有一个从cloudsql数据库读取并写入GCS的管道。文件名中有一个时间戳。
我
希望每次
我
运行它时,它都会生成一个带有不同时间戳的文件。
我
在
本地机器上进行了测试。Beam从postgres数据库读取并写入文件(而不是gcs)。它工作得很好。生成的文件中有不同的时间戳。即使
我
多次运行,时间戳也是不变的。时间戳与上传
数据流
模板的时间非常接近。
浏览 3
提问于2020-08-19
得票数 0
1
回答
PubSub确认截止日期
、
、
我
有一个
云
函数,它将消息发布到PubSub,并触发
云
运行来执行归档文件过程。当有大文件时,
我
的cloud Run python代码需要一些时间来处理数据,它看起来像是PubSub
在
20秒(默认确认截止时间)后重试消息,这将从
我
的Cloud run触发另一个实例。
我
已经将确认截止时间增加到600秒,并重新部署了所有内容,但它在20秒后仍在重试消息。
我
遗漏了什么
吗
?日志记录显示
在
20秒后触发第二个实例: ?
云
浏览 17
提问于2021-07-02
得票数 2
回答已采纳
点击加载更多
相关
资讯
数据流的未来前景如何?
Databricks 开源声明式 ETL 框架,实现流程构建加速90%
机器学习-01-TensorFlow机器学习框架
作为云原生 iPaaS 集成中间件的 Apache Kafka
百度开源高性能 Python 分布式计算框架 Bigflow
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券