腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
pandas
Dataframe
:
高效
地
将
包含
json
的
列
扩展
为
多
列
、
、
、
我有一个
dataframe
,其中一个
列
是一个带有字典
的
json
字符串,我需要将
json
扩展
到单独
的
列
中。以下是我
的
代码和该线程中提出
的
解决方案
的
一个片段: import
json
""=[columnName]) def
浏览 30
提问于2019-12-05
得票数 0
回答已采纳
2
回答
Pandas
惯用
的
将
json
列表映射到
dataframe
的
方式
、
、
我有一个从
json
输入派生
的
数据集,我希望将其映射到
pandas
dataframe
。使用
pandas
.
DataFrame
.from_dict或
pandas
.io.
json
.
json
_normalize加载这类字典
的
列表,会产生一个
包含
两
列
的
数据帧: foo和bar。df = pd.
DataFrame
.from_dict([popo] * 10,
浏览 46
提问于2019-03-04
得票数 2
3
回答
将
pandas
列
中
的
json
扩展
到整个
dataframe
、
、
我有一个
pandas
dataframe
,它有一个
包含
json
值
的
列
。如下所示:0 {"name":"John","role":"manager", "age":40} 1 {"name":"Mary","role":"director",
浏览 0
提问于2021-10-12
得票数 0
1
回答
dask中
的
高效
排序diff
、
、
、
我如何在Dask中以一种“
高效
”
的
方式做以下事情: 我
的
dask
dataframe
有
列
' date‘(日期时间)、' mac’(类别)和'ID‘(int),这些
列
已经按日期排序,我想获得一个新
列
,其中
包含
针对给定mac地址
的
http请求到达
的
timedeltas。在
pandas
中,我会这样做:设置一个
多
索引
的
'ID
浏览 4
提问于2017-02-27
得票数 3
回答已采纳
1
回答
避免
Pandas
将
None隐式转换为
列
元组中
的
NaN
、
我有一个
Pandas
DataFrame
,它
的
列
用Python tuples标记。 这些
列
标签元组可以不
包含
任何内容。有没有一种方法可以使用
DataFrame
[]或
DataFrame
.insert语法向标签为None
的
元组
的
现有数据框添加
列
?(奇怪
的
是,如果您将
包含
元组
列
标签
的
None直接发送到
DataFrame</em
浏览 1
提问于2016-01-05
得票数 1
2
回答
将
包含
JSON
对象
的
Dataframe
扩展
为
更大
的
dataframe
、
、
、
我在
pandas
中有一个两
列
的
dataframe
。一个是ID,另一个是长
JSON
对象,对于数据帧中
的
每个对象都是相同
的
对象。我
的
目标是
为
JSON
对象中
的
每个键创建
列
。以下是输入
的
示例175431467 {"Rate":"50","Groups":&
浏览 2
提问于2017-06-14
得票数 2
回答已采纳
1
回答
如何导入2个CSV文件,如果其中一个文件存在于另一个文件中,如何比较值,并生成最终
的
CSV,其中有一
列
表明值是否存在?
、
、
我有2个
包含
这些
列
的
csv文件 CSV 2所需
的
输出将是另一个CSV文件,其中
包含
来自CSV1
的
所有
列
,并查看它是否存在于CSV2中。“Exist”
列
将
包含
1(如果
为
True )和0(如果
为
False )。有没有办法在不使用
Pandas
的
情况下尽可能
高效
地
完成这项工
浏览 11
提问于2021-03-02
得票数 0
1
回答
如何在
Pandas
Dataframe
中
高效
地
创建
多
列
、
、
、
、
我试图添加大约2000
列
在一个数据,拥有约450 K记录使用某些条件,但它需要很多时间。有人能为此提供
高效
的
解决方案吗?示例代码是这样
的
-Data = pd.
DataFrame
(np.random.randint(0,10000,size=(450000
浏览 4
提问于2021-12-22
得票数 0
1
回答
PySpark:带有标量
Pandas
的
无效returnType
、
、
我正在尝试从
pandas
_udf返回一个特定
的
结构。它在一个集群上工作,但在另一个集群上失败。我尝试在组上运行udf,这需要返回类型
为
数据框架。oneCar.loc[1:, 'Longitude'], return pd.
DataFrame
List(StructField(CarId,IntegerType,true),StructField(Distance,FloatTy
浏览 2
提问于2018-03-26
得票数 5
回答已采纳
3
回答
从python
dataframe
列
中删除非
json
对象行。
、
、
、
、
我有一个
dataframe
,该
列
包含
json
对象和字符串。我想摆脱那些不
包含
json
对象
的
行。下面是我
的
dataframe
的
样子: df = pd.
DataFrame
({'A': ["hello","world",{"a":5,"b":6,&
浏览 2
提问于2017-10-20
得票数 2
回答已采纳
2
回答
在panda
Dataframe
中选择对象类型单元格
的
子集
、
、
、
、
我尝试使用str.split(pat="'")选择对象类型
列
单元格
的
子集 dataset['pictures'].str.split(pat=",") 我想要获取数字40092和39097
的
值以及图片
的
两个日期,作为两
列
ID和DATE,但结果是我得到了一个由NaN组成
的
列
。
浏览 15
提问于2020-04-11
得票数 1
回答已采纳
1
回答
当第3行
的
数据长度大于标题长度时,Python
pandas
.readexcel(文件路径,header=[0,1])会失败。欢迎任何解决方案
的
建议
、
、
、
、
由于有两个头文件,
pandas
给了我一个
多
索引
的
数据帧,这很好。熊猫无法执行给出
的
错误
为
如何指示
pandas
只读取文件
的
65
列
?
将
usecols参数
浏览 0
提问于2018-11-29
得票数 0
2
回答
将
熊猫单列转化为稀疏矩阵
、
、
、
我希望
将
列
a转换为SciPy稀疏CSR矩阵。a是一种概率分布。我希望在不将a展开
为
多
列
的
情况下进行转换。这是一种天真的解决方案,可以
将
a
扩展
为
多个
列
: df_matrix = scip
浏览 0
提问于2020-08-05
得票数 0
回答已采纳
0
回答
将
数据框
列
标题和值拆分为多个
列
、
、
nominal,data,curs,cdx,其中一
列
包含
所有的值,最后一
列
(它是空
的
,因为最后一
列
有编码问题)-不知道是什么。我删除了
列
Column 1,如下所示
dataframe
1.drop(['Column 1'], axis =
浏览 5
提问于2018-07-20
得票数 0
回答已采纳
1
回答
根据Spark
DataFrame
列
的
95%和5%值对其进行裁剪
、
、
、
我正在尝试使用PySpark &Spark2.2
为
我
的
模型制作一个自定义
的
变压器。 我想获取一个
DataFrame
,并基于
列
top 95%和5%创建一个饱和值(最大值和最小值)。(与中位数类似,但
为
0.95 & 0.05) 例如,我想要这个
DataFrame
: col_0 col_11 2 12...............96
浏览 48
提问于2019-03-20
得票数 0
0
回答
pandas
-多个列到"column name - value“
列
、
、
、
、
我有一个
包含
多
列
的
pandas
数据帧,我想将其“扁平化”
为
两
列
-一
列
使用列名,另一
列
使用值。例如。df1 = pd.
DataFrame
({'A':[1,2],'B':[2,3], 'C':[3,4]})df2 = pd.
DataFrame
({'column name':
浏览 5
提问于2017-01-09
得票数 2
回答已采纳
2
回答
在python中使用
Pandas
将
列
附加到数据帧
、
我想从excel文件中提取一些
列
,并将另一
列
添加到这些提取
的
列
中。并希望
将
所有
列
写入新
的
excel文件。为此,我必须将新
列
添加到旧
列
中。这是我
的
密码-#Work.xlsx is input file data但Final_data并没有给我预期
浏览 0
提问于2018-02-13
得票数 1
回答已采纳
2
回答
使用apply get ValueError解压
多
列
列表:如果使用所有标量值,则必须传递索引
、
、
我想将
多
列
列表解压到更多
的
列
中。基本上,但是适用于列表
的
多
列
,而不仅仅是一个,并且避免循环。举个例子,我有一个
pandas
.
DataFrame
我可
浏览 1
提问于2021-01-14
得票数 1
回答已采纳
1
回答
熊猫申请不要用字符串分裂来
扩展
。
我试图使用apply
将
多
列
分隔字符串拆分为4
列
,每个
列
在版本0.25.3上。通过使用.apply和.str.split,我可以得到如下所示
的
列表列1 [2, 10, 8, 11] [2, 6, 6, 3] 2 [9, 4, 7, 10] [2, 1,
浏览 12
提问于2020-08-04
得票数 0
回答已采纳
1
回答
如何
将
单个
dataframe
列
转换为以列名为键
的
每一行
的
字典?
、
、
、
我想使用Spacy
的
Doc
扩展
功能。我需要将
dataframe
列
转换成只
包含
文本
的
元组和一个
包含
列名值对
的
字典。使用
pandas
dataframe
.to_dict(orient='records')很接近,但不允许我只使用1
列
或选择特定
的
列
。
将
to_dict()方法应用于单个数据框
列
也不能使我更接近所需<e
浏览 29
提问于2019-04-24
得票数 1
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
4个解决特定的任务的Pandas高效代码
干货:手把手教你用Python读写CSV、JSON、Excel及解析HTML
肝了3天,整理了90个Pandas案例
数据加载、存储与文件格式
pandas系列学习(三):DataFrame
热门
标签
更多标签
云服务器
ICP备案
对象存储
腾讯会议
云直播
活动推荐
运营活动
广告
关闭
领券