pandas Dataframe:高效地将包含json的列扩展为多列

、、、

我有一个dataframe，其中一个列是一个带有字典的json字符串，我需要将json扩展到单独的列中。以下是我的代码和该线程中提出的解决方案的一个片段： import json ""=[columnName]) def

浏览 30提问于2019-12-05得票数 0

回答已采纳

2回答

Pandas惯用的将json列表映射到dataframe的方式

、、

我有一个从json输入派生的数据集，我希望将其映射到pandas dataframe。使用pandas.DataFrame.from_dict或pandas.io.json.json_normalize加载这类字典的列表，会产生一个包含两列的数据帧: foo和bar。df = pd.DataFrame.from_dict([popo] * 10,

浏览 46提问于2019-03-04得票数 2

3回答

将pandas列中的json扩展到整个dataframe

、、

我有一个pandas dataframe，它有一个包含json值的列。如下所示：0 {"name":"John","role":"manager", "age":40} 1 {"name":"Mary","role":"director",

浏览 0提问于2021-10-12得票数 0

1回答

dask中的高效排序diff

、、、

我如何在Dask中以一种“高效”的方式做以下事情：我的dask dataframe有列' date‘(日期时间)、' mac’(类别)和'ID‘(int)，这些列已经按日期排序，我想获得一个新列，其中包含针对给定mac地址的http请求到达的timedeltas。在pandas中，我会这样做:设置一个多索引的'ID

浏览 4提问于2017-02-27得票数 3

回答已采纳

1回答

避免Pandas将None隐式转换为列元组中的NaN

、

我有一个Pandas DataFrame，它的列用Python tuples标记。这些列标签元组可以不包含任何内容。有没有一种方法可以使用DataFrame[]或DataFrame.insert语法向标签为None的元组的现有数据框添加列？(奇怪的是，如果您将包含元组列标签的None直接发送到DataFrame</em

浏览 1提问于2016-01-05得票数 1

2回答

将包含JSON对象的Dataframe扩展为更大的dataframe

、、、

我在pandas中有一个两列的dataframe。一个是ID，另一个是长JSON对象，对于数据帧中的每个对象都是相同的对象。我的目标是为JSON对象中的每个键创建列。以下是输入的示例175431467 {"Rate":"50","Groups":&

浏览 2提问于2017-06-14得票数 2

回答已采纳

1回答

如何导入2个CSV文件，如果其中一个文件存在于另一个文件中，如何比较值，并生成最终的CSV，其中有一列表明值是否存在？

、、

我有2个包含这些列的csv文件 CSV 2所需的输出将是另一个CSV文件，其中包含来自CSV1的所有列，并查看它是否存在于CSV2中。“Exist”列将包含1(如果为True )和0(如果为False )。有没有办法在不使用Pandas的情况下尽可能高效地完成这项工

浏览 11提问于2021-03-02得票数 0

1回答

如何在Pandas* Dataframe中高效地创建多列*

、、、、

我试图添加大约2000列在一个数据，拥有约450 K记录使用某些条件，但它需要很多时间。有人能为此提供高效的解决方案吗？示例代码是这样的-Data = pd.DataFrame(np.random.randint(0,10000,size=(450000

浏览 4提问于2021-12-22得票数 0

1回答

PySpark:带有标量Pandas的无效returnType

、、

我正在尝试从pandas_udf返回一个特定的结构。它在一个集群上工作，但在另一个集群上失败。我尝试在组上运行udf，这需要返回类型为数据框架。oneCar.loc[1:, 'Longitude'], return pd.DataFrameList(StructField(CarId,IntegerType,true),StructField(Distance,FloatTy

浏览 2提问于2018-03-26得票数 5

回答已采纳

3回答

从python dataframe列中删除非json对象行。

、、、、

我有一个dataframe，该列包含json对象和字符串。我想摆脱那些不包含json对象的行。下面是我的dataframe的样子： df = pd.DataFrame({'A': ["hello","world",{"a":5,"b":6,&

浏览 2提问于2017-10-20得票数 2

回答已采纳

2回答

在panda Dataframe中选择对象类型单元格的子集

、、、、

我尝试使用str.split(pat="'")选择对象类型列单元格的子集 dataset['pictures'].str.split(pat=",") 我想要获取数字40092和39097的值以及图片的两个日期，作为两列ID和DATE，但结果是我得到了一个由NaN组成的列。

浏览 15提问于2020-04-11得票数 1

回答已采纳

1回答

当第3行的数据长度大于标题长度时，Python pandas.readexcel(文件路径，header=[0,1])会失败。欢迎任何解决方案的建议

、、、、

由于有两个头文件，pandas给了我一个多索引的数据帧，这很好。熊猫无法执行给出的错误为如何指示pandas只读取文件的65列？将usecols参数

浏览 0提问于2018-11-29得票数 0

2回答

将熊猫单列转化为稀疏矩阵

、、、

我希望将列a转换为SciPy稀疏CSR矩阵。a是一种概率分布。我希望在不将a展开为多列的情况下进行转换。这是一种天真的解决方案，可以将a扩展为多个列： df_matrix = scip

浏览 0提问于2020-08-05得票数 0

回答已采纳

0回答

将数据框列标题和值拆分为多个列

、、

nominal，data，curs，cdx，其中一列包含所有的值，最后一列(它是空的，因为最后一列有编码问题)-不知道是什么。我删除了列Column 1，如下所示 dataframe1.drop(['Column 1'], axis =

浏览 5提问于2018-07-20得票数 0

回答已采纳

1回答

根据Spark DataFrame列的95%和5%值对其进行裁剪

、、、

我正在尝试使用PySpark &Spark2.2为我的模型制作一个自定义的变压器。我想获取一个DataFrame，并基于列top 95%和5%创建一个饱和值(最大值和最小值)。(与中位数类似，但为0.95 & 0.05) 例如，我想要这个DataFrame： col_0 col_11 2 12...............96

浏览 48提问于2019-03-20得票数 0

0回答

pandas -多个列到"column name - value“列

、、、、

我有一个包含多列的pandas数据帧，我想将其“扁平化”为两列-一列使用列名，另一列使用值。例如。df1 = pd.DataFrame({'A':[1,2],'B':[2,3], 'C':[3,4]})df2 = pd.DataFrame({'column name':

浏览 5提问于2017-01-09得票数 2

回答已采纳

2回答

在python中使用Pandas将列附加到数据帧

、

我想从excel文件中提取一些列，并将另一列添加到这些提取的列中。并希望将所有列写入新的excel文件。为此，我必须将新列添加到旧列中。这是我的密码-#Work.xlsx is input file data但Final_data并没有给我预期

浏览 0提问于2018-02-13得票数 1

回答已采纳

2回答

使用apply get ValueError解压多列列表:如果使用所有标量值，则必须传递索引

、、

我想将多列列表解压到更多的列中。基本上，但是适用于列表的多列，而不仅仅是一个，并且避免循环。举个例子，我有一个pandas.DataFrame我可

浏览 1提问于2021-01-14得票数 1

回答已采纳

1回答

熊猫申请不要用字符串分裂来扩展。

我试图使用apply将多列分隔字符串拆分为4列，每个列在版本0.25.3上。通过使用.apply和.str.split，我可以得到如下所示的列表列1 [2, 10, 8, 11] [2, 6, 6, 3] 2 [9, 4, 7, 10] [2, 1,

浏览 12提问于2020-08-04得票数 0

回答已采纳

1回答

如何将单个dataframe列转换为以列名为键的每一行的字典？

、、、

我想使用Spacy的Doc扩展功能。我需要将dataframe列转换成只包含文本的元组和一个包含列名值对的字典。使用pandas dataframe.to_dict(orient='records')很接近，但不允许我只使用1列或选择特定的列。将to_dict()方法应用于单个数据框列也不能使我更接近所需<e

浏览 29提问于2019-04-24得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Pandas惯用的将json列表映射到dataframe的方式

将pandas列中的json扩展到整个dataframe

dask中的高效排序diff

避免Pandas将None隐式转换为列元组中的NaN

将包含JSON对象的Dataframe扩展为更大的dataframe

如何导入2个CSV文件，如果其中一个文件存在于另一个文件中，如何比较值，并生成最终的CSV，其中有一列表明值是否存在？

如何在Pandas* Dataframe中高效地创建多列*

PySpark:带有标量Pandas的无效returnType

从python dataframe列中删除非json对象行。

在panda Dataframe中选择对象类型单元格的子集

当第3行的数据长度大于标题长度时，Python pandas.readexcel(文件路径，header=[0,1])会失败。欢迎任何解决方案的建议

将熊猫单列转化为稀疏矩阵

将数据框列标题和值拆分为多个列

根据Spark DataFrame列的95%和5%值对其进行裁剪

pandas -多个列到"column name - value“列

在python中使用Pandas将列附加到数据帧

使用apply get ValueError解压多列列表:如果使用所有标量值，则必须传递索引

熊猫申请不要用字符串分裂来扩展。

如何将单个dataframe列转换为以列名为键的每一行的字典？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐