我遇到了一个用例,其中我应该计算移动平均在一个特定的持续时间,例如最近的n天。我知道,如果我存储所有的过去的数据,我可以减去与前几天相应的贡献,这是很容易做到的。但是,我如何有效地计算它,只存储前一天的平均值,而没有以前的数据。
下面是我想要完成的事情
例如,我有5天的数据,比如2,8,5,2,5,现在它的平均值是4.4,如果有第八天的数据是10,那么应该计算运行平均值,去掉前3元素2,8和5,因此平均为3.2。
目前,我采用了一种方法来确定与一天相对应的平均贡献,然后用总平均值减去它,我觉得这是不准确的。
Formula = (avg for past n days) + (today&
我正在创建一个熊猫数据与交易数据(日期,时间,数量,价格)。我使用几个相同的文件(每个文件代表一个交易日)构建数据文件,然后使用5分钟间隔重采样数据。
然后计算每个间隔之间的返回,但我不想计算从一天返回到另一天的返回(即t天的最后一个数据点和第一个t+1日的第一个数据点之间的返回)。
list_=[]
big_df=pd.DataFrame()
#read file into pandas
for file in filelist:
#create panda dataframe
df=pd.read_hdf(fi
假设我有一个包含过去三年的职称和薪水的数据集,我想要计算第一年到最后一年平均工资的差额。
使用Pandas,我会怎么做呢?我已经成功地创建了一个df,其中包含了每年的平均薪资,但我想我想要做的是:“对于数据科学家,用2020年的平均工资减去2022年的平均工资”,然后遍历所有做同样事情的job_titles。
work_year job_title salary_in_usd
0 2020 AI Scientist 45896.000000
1 2020 BI D
我有使用历史数据根据极值理论成功计算VaR的代码。我尝试在多个模拟价格路径上运行相同的代码(即为每个路径计算一个VaR ),然后取这些变量的中位数或平均值。
我在网上找到的每个例子都让模拟函数在期末返回价格,然后他们多次重复函数X。这对我来说是有意义的,除了我基本上需要计算每条模拟路径的风险值。下面是我到目前为止拥有的代码。我可以说,代码在使用历史数据时工作正常(即,当lossOnly、u和evtVar行不在函数中时,"evt“函数工作正常,数据表被正确填充)。然而,我一直在尝试在第二个函数中实现模拟,并尝试了各种组合,但都失败了。
library('RODBC')
l
我有一个这样的数据集: Year Type Return
1900 A 2
1900 B 4
1901 A 7
1901 A 9
1901 B 6
1901 B 5
1903 B 5
1906 A 5 我有两种类型的年度信息和相应的回报。它每年可以有多个类型,但也可以在同一年中重复一个类型。它也可以只有一种类型的年份,以及一些缺失的年份。 我想画一个带有颜色的线形图(可能是ggplot),它显示了A和B的回报在一段时间内的演变。(x轴年份,y轴返回)。当一年中有超过一条信息时(例如在1901年,我们有两个A),我们应该对收益进