腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(252)
视频
沙龙
1
回答
在
Pyspark
中将
json
sturc
值
拆
分为
多个
列
、
我正在将
json
文件导入到
pyspark
dataframe中。我已经用以下代码导入了
json
df = sqlContext.read.
json
("
json
_file.
json
").select("item", "attributes") 我想将属性从一
列
拆
分为
多
列
以下是
json
格式示例: {"item":"item-1&q
浏览 12
提问于2020-01-27
得票数 0
1
回答
在
pyspark
中将
字典
列
拆
分为
多个
列
、
、
、
mr005 {'scissor': 151, 'paper': 143, 'rock': 225}代码: from
pyspark
.sql.typesproduction_unit_id", explode("items_produced").alias("item_p", "item_p_count"
浏览 1
提问于2019-01-21
得票数 0
1
回答
如何读取火花流的分区
列
、
、
、
我有一个火花流工作,在这里我流数据,并将其划
分为
一个或
多个
列
,并存储
在
gcs桶中。下面是示例代码,我将其按团队划分并存储
在
gcs桶中。from
pyspark
import SparkContext spark = SparkSession.builder.getOrCreateparquet').outputMode('append').option('
浏览 5
提问于2022-11-29
得票数 0
回答已采纳
1
回答
Pyspark
dataframe将
json
列
值
拆
分为
顶层的
多个
列
。
、
、
、
、
我有一个
json
列
,它可以包含任意数目的键:
值
对。我想为这些键:
值
对创建新的顶级
列
。bB C D ...几乎没有类似于将coulmns拆
分为
多个
列
的问题,但在这种情况下都不起作用。有谁能帮帮忙。提前感谢!
浏览 0
提问于2017-03-21
得票数 2
1
回答
在
Postgres
中将
包含
Json
值
的
列
拆
分为
多个
列
、
type Encoding column_with_
json
_valuesselect column_with_
json
_values from table_name column_with_
json
_values {"messaging": true, "newsletters我想把这一
列
分成多
列
,每
列
只
浏览 185
提问于2021-08-13
得票数 0
3
回答
是否将数据帧结果
值
保存到字符串变量?
、
、
、
、
我
在
spark中创建了一个dataframe,当找到最大日期时,我想将它保存到变量中。只是想弄清楚如何获得结果,它是一个字符串,并将其保存到一个变量中。
浏览 4
提问于2018-04-21
得票数 5
回答已采纳
1
回答
如何将45
列
行转换为15行,每行3
列
?
、
、
我正在使用一个从电子邮件解析器获取数据的谷歌工作表。每次收到电子邮件时,都会创建一行,并填写以下列:我想把它输出为:.... ....=FILTER
浏览 0
提问于2020-07-02
得票数 -1
1
回答
使用
Pyspark
从数组中读取
JSON
项?
、
、
、
我在从databricks中的Cosmos DB读取项目时遇到了一些问题,它似乎将
JSON
读取为字符串
值
,并将数据从
JSON
中读取到
列
中。我有一个名为ProductRanges的
列
,其中一行包含以下
值
: [ { "min": 0, "max": 99,DB中,
JSON
文档是有效的,当导入数据时,datafram
浏览 29
提问于2019-05-13
得票数 4
回答已采纳
1
回答
用Azure数据流平放
Json
并解析
Json
当我
在
'Info‘列上使用扁平化转换时,它提供了相同的输出。当我尝试解析
json
时,它根本无法转换数据。谢谢
浏览 3
提问于2021-09-08
得票数 0
回答已采纳
1
回答
如何在
pyspark
或Mysql中按键求和
值
、
、
--我不知道如何按索引添加值--帮助我完成以下工作:根据键的
值
的索引添加值Country,ValuesCanada,59;98;24;83;3
浏览 0
提问于2019-12-09
得票数 2
回答已采纳
1
回答
如何在一个字段中保存双重数据?
、
、
、
、
我有两个复选框和一个单选按钮。如果选中第二个复选框,则不要显示单选按钮。以下是代码:$(document).ready(function() { if ($(this).is(":checked")) { } else { $("#radio-button-option").removeClas
浏览 2
提问于2020-04-25
得票数 1
回答已采纳
1
回答
在
sql server
中将
逗号分隔
值
拆
分为
多个
列
。
我有下面的表格1,2,3 Ab,Xy,Pq member1
在
sql server 2008中,我想要一个如下所示的临时表member13 Pq member19 Fg member1 编辑:请检查我的表是否有两个逗号分隔
值
的
列
,对于这些
值
,我需要在最后一个表中显示结果。
浏览 0
提问于2015-11-25
得票数 0
3
回答
如何将数据中的
列
值
拆
分为
多
列
、
我需要将dataframe
列
拆
分为
多个
列
,以确保每个单元格中只包含两个
值
。57797074 Junw | | 23000000| 如果代码包含8位数字,那么
在
每一
列
中将
每两位数字分开
浏览 2
提问于2019-10-05
得票数 0
回答已采纳
1
回答
按
列
加权平均
、
、
结果应为A区为(0.66*3+1*1)/4,B区为(0.33*3+1*1)/4 当然,可以通过将数据转化为python/大熊猫,然后进行一些计算,但是
在
什么情况下我们应该使用
Pyspark
浏览 2
提问于2018-09-09
得票数 3
1
回答
如何确保Quilt数据包在默认情况下在目录UI视图中显示相关信息?
、
、
、
、
在
目录视图中查看时,如何确保给我的用户的相关信息和数据从文件夹/文件的N深度上升到数据包着陆视图?
浏览 6
提问于2022-09-16
得票数 5
回答已采纳
2
回答
从
多个
RDDs提取和保存具有相同密钥的
值
的最佳方法
、
、
我
在
PySpark
中使用从HBase提取的数据创建了两个RDDs。我希望收集具有相同行键的项,存储这些项,然后搜索与每个项关联的
值
。理想情况下,我应该将结果存储
在
一个
pyspark
.sql对象中,因为我希望对其内容应用Levenshtein距离。详细信息:
在
HBase中,我有位置数据,其中行键是给定区域的地散
列
,
在
该区域的
列
中有
多个
地点,位置上有更多的细节(
json
和描述以及其他文本数据)。我有两
浏览 1
提问于2017-07-21
得票数 3
回答已采纳
1
回答
groupBy
在
星火中的聚合函数计数使用
、
、
、
、
我试图
在
pySpark
中用一行代码进行
多个
操作,但不确定这对我的情况是否可行。 stddev('DOWNSTREAM_SIZE').alias("Stddev") .show(20, False) 我的意图是
在
使用timePeriod后添加count(),以获得与每个
值
匹配的记录计数,打印\显示为输出。是否有任何
浏览 3
提问于2017-01-27
得票数 61
回答已采纳
2
回答
在
Pandas DataFrame
中将
文本(包含名称和
值
)
列
拆
分为
多个
列
、
、
、
我有一个很大的数据帧,想要创建的
列
依赖于other中的名称和
值
。我正在寻找一个解决方案,也许是
在
熊猫。在运行之前,我不知道未来
列
的大小。这是一个简单的模式。
浏览 8
提问于2020-05-23
得票数 2
回答已采纳
4
回答
如何在
PySpark
中用NULL替换字符串
值
?
、
、
、
我想做这样的事:基本上,我想用NULL替换一些
值
。但是它不接受这个函数中的任何一个。我该怎么做?
浏览 5
提问于2016-04-27
得票数 34
回答已采纳
1
回答
在
pyspark
中使用给定的列名和
值
将一
列
拆
分为
多个
列
、
、
、
.|我的info列有
多个
用';‘分隔的
值
,它们的格式是' column我希望我的df info
列
根据各自的
值
分成
多个
列
,如下所示 Pre_Col| Info | RS | RSPOS |dbSNPBuildID| SSR |..|RS=115173026;RSPO...| 11517
浏览 0
提问于2017-08-16
得票数 0
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
一个Python大数据处理利器:PySpark入门指南
一文读懂PySpark数据框
一文读懂 PySpark 数据框
遇见YI算法之初识Pyspark(二)
数据加载、存储与文件格式
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券