首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >如何将rdd /数据帧/数据集转换为字符串

如何将rdd /数据帧/数据集转换为字符串
EN

Stack Overflow用户
提问于 2019-09-24 18:06:36
回答 2查看 164关注 0票数 0

如何在spark scala中不使用collect将rdd /数据帧/数据集转换为字符串/列表

EN

回答 2

Stack Overflow用户

发布于 2019-09-24 18:59:49

Spark DataFrame/Dataset/RDD是分布式的数据集合,另一方面,列表是一个集合,不是分布式的。

因此,将RDD转换为列表的唯一方法是将RDD的所有分区放到单个JVM中,并将其转换为列表。这将是有效的收集操作。

简而言之,collect是做你正在做的事情的唯一合适的方法。

票数 1
EN

Stack Overflow用户

发布于 2019-09-24 18:18:41

假设您正在尝试将行中的每一列作为由分隔符分隔的字符串

将rdd行转换为字符串

代码语言:javascript
运行
复制
val out_rdd = rdd.map(x => x.mkString(",")

将数据帧/数据集行转换为字符串

代码语言:javascript
运行
复制
val out_rdd = df.rdd.map(x => x.mkString(",")

希望这能有所帮助!

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/58077865

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档