腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
如何
从
PCollection
中
筛
选出
None
值
、
、
、
、
我的pubsub请求订阅正在发送消息,并且每条消息都有一个
None
值
。作为流水线处理的一部分,我需要找到一种方法来过滤掉
none
值
当然,一些帮助防止
none
值
从
请求订阅到达会更好。我已经设置了一个函数来过滤
none
值
,这个函数似乎可以根据print to console检查来工作,但是当应用一个在
none
类型上崩溃的lambda函数时,我仍然收到错误。def print_row(row): print ro
浏览 21
提问于2019-05-16
得票数 0
回答已采纳
1
回答
如何
将字典作为
PCollection
返回?
、
、
、
对于每个blob,我还必须阅读它,在其中查找一些内容,并将其添加到
从
GCS调用
中
获得的
值
中
。对于每个blob,我必须将步骤2和步骤3
中
有关blob的
值
写入BigQuery 我对管道的想法是这样的:使用该
PCollection
可以获得作为新
PCollection
的blobs列表。使用这些小块的元数据创
浏览 2
提问于2018-05-24
得票数 1
1
回答
如何
在数据流
中
从
bigQuery
中
读取
PCollection
、
、
我有一个
PCollection
的对象,我从公共获得,让我们说:在学生属性
中
,有一个属性(假设为studentID);我希望用这个学生id
从
BigQuery读取属性( class_code ),并将从BQ获得的class_code设置为PCollcetion
中
的学生对象。有谁知道
如何
实现这一点吗?我知道在beam中有一个BigQueryIO,但是如果我想要在BQ
中
执行的查询字符串条件是来自<e
浏览 0
提问于2018-11-08
得票数 2
1
回答
如何
从
选项列
中
筛
选出
None
?
、
我以为这可以提取一个ListString,但不是。(anmKey是OptionString) run(query[Anm].map(_.anmKey).flatMap(_))
浏览 14
提问于2021-10-14
得票数 1
1
回答
如何
解套数据流
中
的嵌套
PCollection
、
要连接两个嵌套结构的堆栈,我们需要在执行连接之前取消
PCollection
的嵌套,因为遇到了挑战(请参阅我的另一个堆栈溢出案例a link)。所以想知道
如何
解除
PCollection
的嵌套。如果有人能给出连接两个嵌套表或
如何
解除PCollections嵌套想法,那就太好了。 我刚刚注意到,我们使用PTransform "Unnest“(link)将集合
从
嵌套集合
中
解套出来。1)
PCollection
empCollection = ReadCollectio
浏览 40
提问于2019-04-06
得票数 0
2
回答
如何
从
云数据流中提取
PCollection
内容?
只想知道
如何
从
PCollection
中提取东西?假设我已经应用了一个Count.Globally,所以结果的
PCollection
中
只有一个数字,但是我
如何
提取它作为一个长
值
呢? 谢谢。
浏览 3
提问于2015-01-18
得票数 3
1
回答
如何
根据
PCollection
的大小编写波束条件
、
、
我有一个
PCollection
,它包含许多MyResult对象。 // Psudo-Code
PCollection
<MyResult> myResul
浏览 2
提问于2022-06-07
得票数 0
1
回答
用于识别的HOG、SIFT和密集SIFT描述符的不同精度
、
、
对于密
筛
,我得到的最大
值
只有38%。因此,为此,我试图使用PCA
从
每个描述符
中
获取主要特性。然后我结合这些主要特征来进行识别。但我得到的结果更糟。为什么密
筛
会造成最坏的结果?为什么当我把所有的主成分(
从
猪、
筛
和密
筛
)组合在一起时,我得到了更坏的结果?? 现在,我只是在一个样本图像
中
做所有的事情。
浏览 1
提问于2014-05-01
得票数 0
2
回答
从
列表
中
筛
选出
无
值
。这段代码是
如何
工作的?
、
我正在搜索
如何
从
列表
中
筛
选出
无
值
,然后找到了这段代码。my_list = [
None
, 1, 1,
None
]它工作得很好,但是没有关于代码是
如何
工作的解释,我也不能弄清楚。有人能解释一下代码是
如何
工作的吗? 谢谢。
浏览 5
提问于2019-07-13
得票数 0
1
回答
如何
在apache beam中使用MongoDB/DocumentDB/Redis作为侧边输入?
、
、
、
在转换过程
中
,我需要查找MongoDB/DocumentDB/Redis,其中存储了我们的参考数据。我正在通过apache beam实现这个用例。我需要使用这些数据库(MongoDB/DocumentDB/Redis)
中
的集合/表作为辅助输入,以便加载一次并从那里进行查找。我希望一次加载所有记录,并使其可用于侧边输入。<String, String>asMap()); 在MongoToKeyValueDoFn类
中
,我将键和
值
放在HashMap
中
浏览 0
提问于2020-12-15
得票数 1
2
回答
使用SideInput加入集合
、
在ParDo函数
中
,当映射
值
时,我们可以
从
sideinput集合
中
获得多个映射记录作为一个集合。在这种情况下,
如何
处理集合以及
如何
将这些
值
的集合返回给
PCollection
。
PCollection
<TableRow> pc1 = ...; ParDo.of(new fnConvertTableRowToRow&
浏览 0
提问于2019-07-24
得票数 0
3
回答
使用Dataflow删除重复项
我有大量的数据文件(1TB)要导入到BigQuery
中
。每一行都包含一个键。在导入数据和创建
PCollection
以导出到BigQuery时,我希望确保不会根据这个键值导入重复的记录。在我使用Dataflow的Java程序
中
,最有效的方法是什么? 谢谢
浏览 5
提问于2015-02-10
得票数 4
回答已采纳
1
回答
从
PCollection
<TableRow>转换到
PCollection
<KV<K,V>>
我试图
从
BigQuery
中
的两个表中提取数据,然后通过CoGroupByKey加入它。虽然BigQuery的输出是
PCollection
<TableRow>,但是CoGroupByKey需要
PCollection
<KV<K,V>>。
如何
将
PCollection
<TableRow>转换为
PCollection
<KV<K,V>>
浏览 5
提问于2016-12-20
得票数 0
回答已采纳
1
回答
Beam SQL - SqlValidatorException:找不到对象'
PCOLLECTION
‘
、
我
从
转换SampleSource
中
获得一个
PCollection
<Row>,并将其输出传递给一个SqlTransform。String sql1 = "select c1, c2, c3 from
PCOLLECTION
where c1 > 1"; 下面的代码运行时没有任何错误。org.apache.beam.repackaged.beam_sdks_java_extensions_sql.org.apache.calcite.sql.validate.SqlValidatorExc
浏览 7
提问于2019-07-02
得票数 0
1
回答
在键值对的
PCollection
中
查找具有最大
值
的键
我有一个
PCollection
of KV<String,Integer>项,我想找到
值
最大的对。 Max.integersPerKey给出了与输入
中
的每个键相关联的最高
值
的键值对的
PCollection
;我只想要一个具有全局最高
值
的项目。Max.integersGlobally需要整数的
PCollection</em
浏览 0
提问于2018-07-10
得票数 0
回答已采纳
1
回答
带有python pardo和多pCollections输入的apache梁
、
我有2个相同格式的pCollections,我还有另一个其他格式的
pCollection
。我试着做一个ParDo函数,对于
pCollection
3
中
的每个项目,根据这个项目的
值
,搜索项目是否存在于
pCollection
1或2
中
,以完成
pCollection
1或2的信息输出。但我不知道这个ParDo函数是
如何
做到的。这是我的代码:
pCollection
1,
pCollection</em
浏览 0
提问于2020-09-21
得票数 3
1
回答
基于时间戳的数据流有界数据过滤
、
在我的数据流管道
中
,我将从PCollections<TableRow>表
中
读取两个BigQuery。我计划将这两个PCollections合并成一个带有的
PCollection
。因为BigQuery仅仅是附加的,所以目标是用一个新的
PCollection
在BigQuery
中
编写第二个表。 我已经阅读了文档,这是我困惑的中间步骤。所有
PCollection
<TableRow>s都包含相同的
值
:即:字符串、整数和时间戳。当涉及到键值对时,云数据流上的
浏览 9
提问于2016-06-11
得票数 0
回答已采纳
1
回答
Apache光束-并行Google Cloud Storage Blob下载,同时保持Blob分组
、
我希望能够在单个
PCollection
元素
中
维护一组实体,但可以并行地
从
Google Cloud Storage获取这些实体。我的用例是,在我的管道
中
的某一点上,我拥有作为输入的
PCollection
<String>。
PCollection
的每个元素都是一个GCS glob模式。我遇到的挑战是:
如何
将拆分的调用分组/收集回DoFn
中
的单个输出
值
?这似乎适用于我的用例,但我不知道/不知道
如何</e
浏览 6
提问于2021-03-30
得票数 0
2
回答
用非无
值
从
元组创建dict
在下面给出的代码
中
,我有一个具有许多
None
值
的
None
(如ref中所打印的)。我正在使用在主代码
中
其他地方定义的这个dictionary和self.entries创建一个ref。print(type(datadict)) print(datalist) 代码的结果(如下所示)显然包含无
值
的键',
None
,
None
,
None
,
None
浏览 4
提问于2016-02-14
得票数 0
回答已采纳
1
回答
如何
将Apache Crunch的输出写入亚马逊S3存储桶
、
有没有一种方法可以让我们把Apache Crunch输出写到S3存储桶
中
。在crunch流水线写入中有一种以Target为参数的方法。有没有办法将S3作为目标添加到crunch的编写方法
中
。
浏览 12
提问于2021-01-27
得票数 0
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
Python数据处理技巧:如何将数据列表中的空值补0
Seaborn可视化-柱状图 seaborn.barplot
Python数据分析之pandas(三)
玩转Pandas,让数据处理更easy系列5
python数据可视化seaborn(一)整体样式与调色板
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券