在Python语言中,可以使用以下代码将dataset.info()
的结果存储到dataframe中:
import pandas as pd
# 假设dataset是一个数据集
dataset = ...
# 使用StringIO模拟将info结果输出到字符串中
from io import StringIO
info_output = StringIO()
dataset.info(buf=info_output)
# 将info结果存储到dataframe中
info_output.seek(0)
df_info = pd.read_csv(info_output, sep='\s{2,}', engine='python')
# 打印dataframe中的结果
print(df_info)
这段代码首先导入了pandas
库,然后创建了一个StringIO
对象info_output
,用于将dataset.info()
的结果输出到字符串中。接下来,调用dataset.info(buf=info_output)
将info
结果输出到info_output
中。
然后,将info_output
的指针移动到文件开头,以便读取其中的内容。使用pd.read_csv()
函数读取info_output
中的内容,并指定分隔符为至少两个空格(\s{2,}
),引擎为python
。最后,将读取到的结果存储到df_info
的dataframe中。
你可以根据需要对代码进行适当的修改和调整,以适应具体的数据集和需求。
领取专属 10元无门槛券
手把手带您无忧上云