首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >Pycharm问题集(从步骤3开始)

Pycharm问题集(从步骤3开始)
EN

Stack Overflow用户
提问于 2022-10-23 11:50:48
回答 1查看 45关注 0票数 -1
  1. 使用ff_monthly.csv数据集法语,使用第一列作为索引(,它以字符串形式包含数据的年份和月份。
  2. 创建一个新列“Mkt”为“Mkt-RF”+“RF”
  3. 在加载的DataFrame中创建两个新的列(),即“月份”和“年份”,以包含从索引列提取的数据集的年份和月份。
  4. 创建一个新的DataFrame,其列为“平均值”和“标准差”,以及从(b)开始的全部年份。
  5. 编写一个函数,接受(r_m,s_m)返回序列的月均值和标准差,并返回元组(r_a,s_a),即年化均值和标准差。使用公式: r_a =(1+r_m)^12-1,s_a = s_m * 12^0.5。
  6. 循环遍历每年的数据,并计算新的‘Mkt’列的年化平均值和标准差,将每个值存储在新创建的DataFrame中。注意,输入文件中的值是%返回,需要除以100才能返回小数(即2022年8月的值表示返回率为-3.78%)。。打印DataFrame并将其输出到csv文件中。

迄今的工作:

将熊猫作为pd导入

Ff_monthly=pd.read_csv(r“文件路径”)

Ff_monthly=pd.read_csv(r“文件路径”,index_col=0)

Mkt=ff_月度‘Mkt-RF’+ff_每月‘RF’

ff_monthly= ff_monthly.assign(Mkt=Mkt)

df=pd.DataFrame(ff_monthly)

在这里输入图像描述

EN

回答 1

Stack Overflow用户

发布于 2022-10-23 12:54:18

有几件事需要注意。

  1. DateDataFrame的索引。与普通列相比,这是一种特殊的处理方式。这就是df.Date给出属性错误的原因。Date不是属性,而是索引。相反,尝试df.index
  2. 如果您的df.Date.str.split("_", expand=True)看起来像22_10,那么Date就可以工作。然而,根据您的图片,它不包含下划线,也包含日期,因此这是行不通的
  3. 实际上,您的格式甚至没有遵循任何标准。为了正确地处理这个问题,最好的方法是把这个解析成一个合适的datetime64[ns]类型,熊猫可以用df.index = pd.to_datetime(df.index, format='%y%m%d')理解它。有关受支持的格式字符串,请参见python docu

如果所有这些都有效的话,那么创建这些列应该是非常简单的。

代码语言:javascript
运行
复制
df['year'] = df.index.dt.year

事实上,这部分已经被问到在此之前

票数 1
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/74170909

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档