腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
读取
BigQuery
表
的
最佳方法
、
、
、
从
BigQuery
读取和过滤数据,我有两种方法 在
数据流
(
使用
BigQuery
(BigqueryIO.readTableRow.from(
ValueProvider
)
中
读取整个数据,然后根据最大数据这样
的
条件进行过滤通过只获取所需数据
的
查询在
数据流
中
使用
BigQuery
读取NestedValueProvider要慢得多。因为如果我读取整个数据,而我
的
表处于附加模式,就会出现问
浏览 1
提问于2018-08-08
得票数 0
回答已采纳
1
回答
使用
ValueProvider
格式化
数据流
中
的
BigQuery
、
、
、
我目前正在
使用
Dataflow在python中进行循环批处理。pipeline_options = PipelineOptions() | "doing stuff" >> beam.Map(do_some_stuff) )
浏览 16
提问于2019-10-22
得票数 2
回答已采纳
1
回答
当从
BigQuery
采购时,beam管道是否在源查询中保持顺序?
、
我们有一个用Java编写
的
beam管道,我们运行在GCP
数据流
上。我们最近确定了将这些事件插入公共主题
的
顺序是重要
的
。我们可以在针对
BigQuery
发出
的
查询中
使用
order来确定正确
的
顺序,但是当数据插入公共主题时,我们对该顺序是否会被遵守表示怀疑。我们主要关注
的
是在这个代码
中
:
浏览 3
提问于2022-03-01
得票数 0
回答已采纳
1
回答
如何
使用
参数在运行时更改
数据流
作业图?
、
我
使用
Dataflow读取JDBC表
中
的
数据,并将结果加载到
BigQuery
表
中
。我希望在运行时传递一个参数“标志”,如果将标志设置为True,结果应该加载到
BigQuery
中
的
另一个表
中
。概括如下: 如果标记设置为True -从JDBC读取表A,则在
BigQuery
中
写入表
浏览 11
提问于2021-12-15
得票数 -1
2
回答
Google Cloud Dataflow (Apache Beam) -总是无法解析gzip文件
的
第一行
、
、
我在GCS中用GCS压缩了行分隔符
的
JSON文件。我想
使用
数据流
加载它们,然后将其保存到
BigQuery
。你知道为什么会发生这种情况吗?我
使用
的
是Apache Beam Java SDK 2.1.0版。我
的
代码如下所示: static cla
浏览 0
提问于2017-10-23
得票数 0
1
回答
Google :
使用
运行时参数创建模板
、
在
数据流
中
,我需要将开始日期和结束日期作为运行时参数传递,并查询
bigquery
以获取该日期范围,并将输出写入日期明智
的
文件夹。当我们
使用
ValueProvider
时,getStartDate().get()方法将从运行时上下文中抛出java.lang.RuntimeException: Not。如果在getStartDate().get().isAccessible()为false时硬编码某些值,则将生成模板,但运行时参数没有反映在作业
中
。在创建模板时,它总是
浏览 3
提问于2017-03-16
得票数 2
回答已采纳
2
回答
如何实现动态BigQueryIO输入
、
、
我正在
使用
谷歌
数据流
上
的
阿帕奇光束。 我
的
流水线从
BigQuery
读取数据,但它依赖于执行参数。我应该能够用一个点(经度,纬度)和几个点来运行管道。只有一点,解决方案很简单:我可以将查询设置为
ValueProvider
。我尝试在每个点上应用
BigQuery
read,并将结果合并到一个PCollection
中
,但我不知道如何将点传递到管道并动态构建它。
浏览 16
提问于2019-01-27
得票数 0
回答已采纳
1
回答
GCP
数据流
模板:无法自定义google提供
的
基于java
的
PubSubToBQ模板
、
、
、
、
问题陈述是我们正在自定义PubSubToBQ提供
的
PubSubToBQ
数据流
java模板,在该模板
中
我们将配置多个订阅/主题来读取数据并将数据推送到多个
Bigquery
表
中
,这需要作为单个
数据流
管道执行目标:我
的
目标是
使用
Google提供
的
PubSubTOBQ.java类模板,并通过相应
的
Bigquery
传递订阅列表,并创建每个表传递订阅
的
管道。因此,n-n,n个管道在一
浏览 0
提问于2019-07-16
得票数 0
2
回答
数据流
:我可以用批处理作业连续写入/流写入
BigQuery
吗?
、
、
我有一个apache管道,它接收一些信息,将其
格式化
为TableRows,然后写入
BigQuery
。直到
数据流
作业完成后,才会将行写入
BigQuery
。如果我有一个需要很长时间
的
数据流
作业,我希望能够看到插入到
BigQuery
中
的
行,谁能给我指明正确
的
方向? 提前感谢
浏览 0
提问于2018-06-08
得票数 1
1
回答
为什么Apache每次运行
使用
相同
的
JobId?
、
、
、
我正在运行一个批处理
数据流
作业,它从
BigQuery
表
中
读取所有行,将它们转换为JSON字符串,然后将字符串写入PubSub主题。此模板将以相同或不同
的
参数重用,并且应该始终在
BigQuery
中发布已找到
的
行,而不管它是否与最后一个作业相同。我遇到
的
问题是,在每次作业运行之后,我必须再次上传模板,否则下一个作业将在没有从
BigQuery
读取任何内容
的
情况下成功,即使具有与第一个成功作业相同
的
参数。我尝试
使用<
浏览 4
提问于2020-11-30
得票数 0
1
回答
无法序列化com.google.api.services.
bigquery
.
Bigquery
$Tables
、
我正在
使用
Bigquery
,Tables通过传递一个初始化
的
tableRequest作为参数来请求从DoFn内部获取
bigquery
表
的
模式,如下所示
Bigquery
.Tables tableRequest;
浏览 10
提问于2017-08-29
得票数 0
回答已采纳
1
回答
无法将
BigQuery
表名作为
ValueProvider
传递给
数据流
模板
、
、
我想将
BigQuery
表名作为运行时参数传递给我
的
数据流
模板,就像这样: class UserOptions(PipelineOptions): def _add_argparse_argswrite_disposition=beam.io.BigQueryDisposition.WRITE_TRUNCATE))) p.run().wait_until_finish() 根据这些answer1和answer2
的
建议,我在命令行
中
添加了--experimen
浏览 12
提问于2020-12-16
得票数 0
1
回答
BigQueryIO:通过选项配置
的
查询,但“值仅在运行时可用”
、
、
Apache Beam 2.9.0 我已经建立了一个从
BigQuery
中提取数据并对其执行一系列转换
的
管道。这些选项具有
使用
ValueProvider
附加
的
开始日期
ValueProvider
<String> getStartTime(); void setStartTime(
ValueProvider
<String> startTime); 然后,我
使用
BigQueryIO拉取数据(为了明确说明发生了什么,稍微修改了一下内容
浏览 13
提问于2019-02-24
得票数 1
1
回答
数据流
BigQuery
从
ValueProvider
读取:'StaticValueProvider‘对象没有属性'projectId’
、
、
我正在为apache
使用
Python。我试图通过一个
BigQuery
从
ValueProvider
读取数据(因为声明这些数据是允许
的
)。def run(bq_source_table:
ValueProvider
, (
浏览 1
提问于2021-05-04
得票数 0
2
回答
从
BigQuery
到PubSub摄取数据
的
最快方法
、
、
目前,我正在研究GCP文档,试图找出从
BigQuery
(
使用
Python)到PubSub
的
最佳/最快
的
摄取数据
的
方法。到目前为止,我所做
的
(以简化
的
方式)是:MAX_BATCH_MESSAGES = 20 publ
浏览 19
提问于2022-07-05
得票数 0
1
回答
Google模板\ Python \ LImitations
、
请社区总结Python在Google DataFlow模板上
的
局限性 如果我错了,请纠正我。
浏览 0
提问于2020-08-19
得票数 0
回答已采纳
1
回答
Bigquery
和Cloud
的
GCP加密通过束/
数据流
API
、
、
、
、
上下文:我们试图
使用
数据流
(Apache )将一些CSV格式数据加载到GCP
BigQuery
中
。作为其中
的
一部分,这是第一次(对于每个表)通过BigQueryIO API创建烧烤表。客户需求之一是GCP上
的
数据需要
使用
客户提供
的
/托管加密密钥进行加密。 问题陈述:在创建表时,无法通过API指定“自定义加密密钥”。GCP文档详细介绍了如何通过GCP烧烤控制台指定自定义加密密钥,但在DataFlow代码
中
找不到任何用于通过AP
浏览 0
提问于2018-02-15
得票数 1
1
回答
DynamicDestinations
中
的
错误: Apache
、
getSideInputs(bqDataView)).withCreateDisposition(BigQueryIO.Write.CreateDisposition.CREATE_NEVER)); at org.apache.beam.sdk.options.
ValueProvider
$NestedValueProvider.get(
ValueProvider
.java:131) at org.apache.beam.sdk.options.
ValueProvider
$Neste
浏览 4
提问于2017-07-24
得票数 0
回答已采纳
2
回答
谷歌
数据流
:从谷歌存储
中
的
文件读取
的
AvroIO作为运行时参数传递
、
、
、
、
我想
使用
java SDK 2读取
数据流
中
的
Avro文件。
ValueProvider
<String> getInputFile();我正在尝试
使用
以下代码读取此输入文件Ru
浏览 3
提问于2017-11-16
得票数 0
2
回答
数据流
:在模板中
使用
运行时参数
正在尝试为
数据流
作业创建模板。到目前为止,无论在创建模板时
使用
了什么参数,但当我尝试为变量传递不同
的
值时,它不会选择运行时值。如果需要任何额外
的
细节,将提供相同
的
。
浏览 0
提问于2018-09-06
得票数 2
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
net中的数据流模式
使用驱动器X:中的光盘之前需要将其格式化,是否需要将其格式化?
深度学习基础-tensorflow 中的数据流
使用驱动器J:中的光盘之前需要将其格式化 还有救吗?
对TensorFlow中数据流图的可视分析
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券