在Google Cloud Dataprep中,如果你想跨多列计算值的分布并计数,你可以使用CROSS JOIN
结合GROUP BY
和COUNT
函数来实现。但是,Dataprep的界面主要是为非技术用户设计的,因此它通常会隐藏一些复杂的SQL操作。不过,你可以通过以下步骤来实现这一需求:
CROSS JOIN
操作来将你的数据集与其自身连接。GROUP BY
操作来按你选择的列分组。COUNT
操作来计算每个组的数量。如果你更喜欢使用SQL,你可以在Dataprep中编写自定义SQL查询来实现这一需求。以下是一个示例SQL查询:
SELECT
t1.column1,
t2.column2,
COUNT(*) AS count
FROM
`your_dataset.your_table` t1
CROSS JOIN
`your_dataset.your_table` t2
WHERE
t1.column1 = t2.column1 -- 根据需要添加其他条件
GROUP BY
t1.column1,
t2.column2
将上述SQL查询粘贴到Dataprep的SQL编辑器中,并运行它以查看结果。
DB TALK 技术分享会
DBTalk
Elastic Meetup
云+社区技术沙龙[第20期]
DBTalk技术分享会
Techo Day 第三期
云+未来峰会
Elastic 中国开发者大会
云+社区技术沙龙[第22期]
领取专属 10元无门槛券
手把手带您无忧上云