腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
在
Spark
scala
中将
dataframe
列
的
数组
展
平
为
单独
的
列
和
相应
的
值
、
、
、
下面是我
的
数据框架。我正在通过将java Json列表转换为
dataframe
来获取此
dataframe
。FR~FR~FR |Copyright 2022|这只是示例数据,我实际上有大约180
列
需要转换为上面的表格格式下面是我尝试拆分
的
代码,但它没有给我想要
的
输出。
浏览 15
提问于2021-06-03
得票数 0
回答已采纳
1
回答
扁平化pyspark嵌套结构- Pyspark
、
、
、
我想将嵌套
列
展
平
为
单独
的
列
,其中只包含几个特定
值
。 此列具有以下结构。 我下一步要做
的
是
展
平
该
列
的
剩余特定
浏览 13
提问于2021-05-17
得票数 0
2
回答
将海量JSON文件读入
Spark
Dataframe
、
、
、
我有一个很大
的
嵌套NDJ (新行分隔
的
JSON)文件,我需要将其读取到单个
spark
dataframe
中并保存到parquet中。
在
尝试呈现模式时,我使用以下函数: case _ => Array(col(colName))
浏览 2
提问于2016-12-10
得票数 5
2
回答
Spark
在
UDAF之后将SQL行
展
平
为
新
列
、
、
我有一个
Spark
dataframe
,我在上面做了一个groupBy,一个用户定义
的
聚合
和
一个库聚合:这会产生类似如下
的
结果:
浏览 8
提问于2016-04-14
得票数 1
2
回答
如何在
spark
数据帧/
spark
sql中读取带模式
的
json
、
、
、
sql/dataframes,请帮我解决这个问题,或者就如何阅读这个json提供一些好
的
建议。
浏览 0
提问于2016-09-07
得票数 9
回答已采纳
1
回答
将数据帧中
的
多个字典
列
解析
为
单独
的
列
、
、
、
我有一个pandas数据框架,它有一个包含多个字典
值
的
单列。 我使用pd.series将这些字典
展
平
为
单独
的
列
。现在,一
列
被拆分为14
列
。但它仍然
在
14
列
的
每一行中都有字典
值
。以A,B,C
的
方式具有14
列
的
样本数据: index Avalue': '764065
浏览 9
提问于2020-01-28
得票数 0
回答已采纳
1
回答
将RDD转换为
Dataframe
Spark
、
、
、
如何在
scala
中将
具有以下结构
的
RDD转换为
dataframe
这里,RDD
的
每一行都包含一个索引Long
和
一个向量org.apache.
spark
.mllib.linalg.Vector。我希望将org.apache.
spark
浏览 2
提问于2017-02-26
得票数 2
0
回答
将
数组
展
平
为
字符串
、
、
、
、
我正在尝试使用
spark
-redshift连接器将嵌套
的
JSON保存到redshiftval baske
浏览 2
提问于2016-07-13
得票数 1
回答已采纳
1
回答
在
本地使用
spark
/
scala
查询数据时,如何更改
列
中值
的
输出?
、
、
、
、
我使用
spark
/
scala
本地将json文件转换为
dataframe
。 我当前
的
dataframe
有一个
列
‘男性’
和
‘女性’
值
,如下所示。我想将
dataframe
中
的
‘男性’更改为'M',以及使用
Spark
-sql<code>E 215</code>将‘where’更改为'F'
的
位置。到目前为止,
浏览 5
提问于2021-07-19
得票数 1
1
回答
如何将arrays[String]
列
转换为字符串列
、
、
、
在
scala
+
spark
中,我有一个包含两
列
Array[String]
的
数据 |-- v2: array (nullable = true)我想根据v1中
相应
索引
的
浏览 0
提问于2019-08-10
得票数 1
回答已采纳
2
回答
如何
展
平
结构
数组
类型
的
列
(由
Spark
ML API返回)?
、
、
也许只是因为我对API比较陌生,但我觉得
Spark
ML方法经常返回不必要
的
难以使用
的
DFs。
scala
> val arrayType = ArrayType(new StructType().add("itemId", IntegerType).add("rating", FloatType))
scala</
浏览 0
提问于2017-10-14
得票数 6
回答已采纳
1
回答
如何创建countVectorizer模型
的
一个
列
中包含
值
数组
的
火花数据
、
、
我正在尝试执行星火
的
countVectorizer模型。作为这个需求
的
一部分,我正在读取一个csv文件并从其中创建一个
Dataframe
(inp_DF)。中创建第4
列
,其中包含所有这3
列
的
值
数组
,如| indiana|需要这个
数组
,因为cou
浏览 1
提问于2017-09-05
得票数 0
回答已采纳
1
回答
如何在Stan模型中传递不同长度
的
向量列表
和
不同维度
的
矩阵列表?
、
、
我需要将数据作为不同长度
的
向量列表
和
行数相同但
列
数不同
的
矩阵列表传递。有没有一种方法可以将数据传递到Rstan中?
浏览 5
提问于2019-03-27
得票数 2
2
回答
AnalysisException: CSV数据源不支持array<struct<
、
、
我
在
工作,我需要立即帮助,请我有一个拼花文件,我需要将其转换为csv。你能帮帮我吗?抱歉
的
printshema: root |-- Locale: string (nullable = true) |-- workExperience
浏览 684
提问于2021-09-01
得票数 0
回答已采纳
1
回答
创建一个由0
和
1组成
的
矩阵以保持其形状
、
、
、
我尝试创建一个矩阵1,如果每个第二
列
的
值
大于前一个
列
值
,如果小于0,当我使用np.where时,它只是将它
展
平
,我想保持第一
列
和
最后一
列
的
形状。df = pd.
DataFrame
(np.random.randn(8, 4),columns=['A', 'B', 'C', 'D']) newd=pd.<
浏览 0
提问于2018-12-28
得票数 0
回答已采纳
2
回答
星火SQL抛出错误"java.lang.UnsupportedOperationException:未知字段类型:空“
、
、
、
当创建一个
列
值
默认
值
为
NULL
的
表时,我
在
Spark
(1.6) SQL中获得了下面的错误。示例:将表测试创建
为
select column_a,NULL作为column_b从test_temp创建; 同样
的
东西
在
Hive中工作,并创建数据类型
为
"void“
的
列
。我使用空字符串而不是NULL来避免异常
和
新
列
获取字符串数据类
浏览 3
提问于2017-12-27
得票数 0
回答已采纳
1
回答
从
数组
和
列表创建pandas系列
、
我正在尝试将
数组
数据映射到列名列表 cols = list(X.columns)pd.Series(data=a,index=cols) 但是一直收到这个错误消息ValueError: Length of passed values is 1, index implies 32 中
的
数据示例。-3.65628250e-02, 8.46421904e-02, -3.97469438e-03, 1.05515634e+00, -6.57530123e-01]])
和
cols中
的<
浏览 18
提问于2019-06-04
得票数 1
回答已采纳
7
回答
如何在
spark
的
数据中“负选择”
列
、
、
、
这个df有"A“、"B”
和
"C“
列
。现在假设我有一个Array,它包含这个df
列
的
名称:我想以这样
的
方式来做一个df.select(),这样我就可以指定哪些
列
不能选择。例如:假设我不想选择
列
"B“。我试过了 df.select(column_names.filter(_!="B"))
浏览 21
提问于2015-07-15
得票数 22
回答已采纳
1
回答
将
数组
类型
的
列
处理
为
udf时
的
Spark
- java.lang.ClassCastException [
数组
[Map[String,String]
、
、
、
我连接了Array[Map[String,String]]类型
的
spark
中
的
两个
列
,生成了一个新
的
Array[Array[Map[String,String]]]类型
的
列
。但是,我希望将该
列
展
平
,以获得一个Array[Map[String,String]]类型
的
列
,其中包含两个原始
列
的
值
我从
Spark
2.4
浏览 30
提问于2020-12-24
得票数 0
回答已采纳
2
回答
SQL Server
展
平
数据
、
、
、
tUsers -colorid -uid_fk用户选择他们喜欢
的
颜色,并且只选择他们喜欢
的
颜色。我需要将其
展
平
,以便每个用户都有一条以tColors中
的
颜色作为列名
的
记录,并且根据他们
在
tColors_User_Detail中是否有记录,每种颜色在行中都有一个True/False
值
。如果用户没有
在<
浏览 2
提问于2015-09-15
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
腾讯会议
云直播
对象存储
活动推荐
运营活动
广告
关闭
领券