首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >向熊猫DataFrame添加元信息/元数据

向熊猫DataFrame添加元信息/元数据
EN

Stack Overflow用户
提问于 2013-02-04 13:59:18
回答 12查看 66.8K关注 0票数 137

能为熊猫DataFrame添加一些元信息/元数据吗?

例如,用于测量数据的仪器名称、负责的仪器等。

一种解决方法是使用该信息创建一个列,但是在每一行中存储一条信息似乎是浪费的!

EN

回答 12

Stack Overflow用户

回答已采纳

发布于 2013-02-04 14:03:39

当然,与大多数Python对象一样,您可以将新属性附加到pandas.DataFrame

代码语言:javascript
运行
复制
import pandas as pd
df = pd.DataFrame([])
df.instrument_name = 'Binky'

但是,请注意,虽然可以将属性附加到DataFrame,但在DataFrame上执行的操作(例如groupbypivotjoinloc仅举几个例子)可能会返回一个新的DataFrame,而不需要附加元数据。熊猫还没有一个强大的传播附加到DataFrames的元数据的方法。

保存文件中的元数据是可能的。您可以找到一个示例,说明如何在HDF5文件这里中存储元数据。

票数 101
EN

Stack Overflow用户

发布于 2020-02-04 18:32:23

从熊猫1.0开始,可能更早的时候,这里就有了Dataframe.attrs的房产。这是实验性的,但这可能是你将来想要的。例如:

代码语言:javascript
运行
复制
import pandas as pd
df = pd.DataFrame([])
df.attrs['instrument_name'] = 'Binky'

在docs 这里中找到它。

to_parquetfrom_parquet尝试这一点,它似乎不会持久,所以请确保用您的用例来检查它。

票数 62
EN

Stack Overflow用户

发布于 2014-09-07 23:31:15

我自己也遇到了这个问题。从熊猫0.13开始,DataFrames有一个_metadata属性,这个属性通过返回新DataFrames的函数持续存在。而且,序列化似乎也挺好的(我只试过json,但我认为hdf也包括在内)。

票数 14
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/14688306

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档