能为熊猫DataFrame添加一些元信息/元数据吗?
例如,用于测量数据的仪器名称、负责的仪器等。
一种解决方法是使用该信息创建一个列,但是在每一行中存储一条信息似乎是浪费的!
发布于 2013-02-04 14:03:39
当然,与大多数Python对象一样,您可以将新属性附加到pandas.DataFrame
import pandas as pd
df = pd.DataFrame([])
df.instrument_name = 'Binky'但是,请注意,虽然可以将属性附加到DataFrame,但在DataFrame上执行的操作(例如groupby、pivot、join或loc仅举几个例子)可能会返回一个新的DataFrame,而不需要附加元数据。熊猫还没有一个强大的传播附加到DataFrames的元数据的方法。
保存文件中的元数据是可能的。您可以找到一个示例,说明如何在HDF5文件这里中存储元数据。
发布于 2020-02-04 18:32:23
从熊猫1.0开始,可能更早的时候,这里就有了Dataframe.attrs的房产。这是实验性的,但这可能是你将来想要的。例如:
import pandas as pd
df = pd.DataFrame([])
df.attrs['instrument_name'] = 'Binky'在docs 这里中找到它。
用to_parquet和from_parquet尝试这一点,它似乎不会持久,所以请确保用您的用例来检查它。
发布于 2014-09-07 23:31:15
我自己也遇到了这个问题。从熊猫0.13开始,DataFrames有一个_metadata属性,这个属性通过返回新DataFrames的函数持续存在。而且,序列化似乎也挺好的(我只试过json,但我认为hdf也包括在内)。
https://stackoverflow.com/questions/14688306
复制相似问题