Pandas文档列出了一系列“扩展窗口函数”:
http://pandas.pydata.org/pandas-docs/version/0.17.0/api.html#standard-expanding-window-functions
但是我不能从文档中弄清楚他们做了什么。
发布于 2017-07-28 10:29:01
您可能想要阅读this Pandas docs
滚动统计的一种常见替代方法是使用扩展窗口,该窗口使用生成统计值,其中包含到该时间点之前可用的所有数据。
它们遵循与.rolling类似的接口,即.expanding方法返回扩展对象。
由于这些计算是滚动统计的特例,它们在pandas中实现,因此以下两个调用是等效的:
In [96]: df.rolling(window=len(df), min_periods=1).mean()[:5]
Out[96]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
In [97]: df.expanding(min_periods=1).mean()[:5]
Out[97]:
A B C D
2000-01-01 0.314226 -0.001675 0.071823 0.892566
2000-01-02 0.654522 -0.171495 0.179278 0.853361
2000-01-03 0.708733 -0.064489 -0.238271 1.371111
2000-01-04 0.987613 0.163472 -0.919693 1.566485
2000-01-05 1.426971 0.288267 -1.358877 1.808650
发布于 2020-04-22 05:50:10
发布于 2020-01-30 13:01:16
在一行中总结滚动函数和扩展函数的区别:在滚动函数中,窗口大小保持不变,而在扩展函数中,窗口大小发生变化。
例如:假设你想预测天气,你有100天的数据:
- Window size expands continuously in later method.
代码示例:
sums = series.expanding(min_periods=2).sum()
series
包含时间序列中以前下载的应用数量的数据。上面写的代码行和所有下载的应用程序的数量,直到那个时候。
注意:min_periods=2
意味着我们至少需要2个以前的数据点来聚合。我们在这里的总和是总和。
https://stackoverflow.com/questions/45370666
复制相似问题