如何在Apache中将行转换为字符串值
我有一个这样的火花数据模型:
fruit | name
--------------
fruit | apple
fruit | orange
fruit | mango
我想把它转化为:
fruit | string
----------------------------
fruit | apple, orange, mango
我如何在Apache中实现这一点?
发布于 2016-11-30 10:13:30
看看collect_list
df.groupBy("fruit").agg(collect_list("name"))
它将对值进行分组,并将其作为新列创建数组。
如果您想要字符串,请参见this问题(谢谢@mtoto)
https://stackoverflow.com/questions/40885116
复制相似问题