我有一个考虑年度时间序列和三年滚动平均值的数据集。
country city 2014 2015 2016 2017 2018 2019 2014-16 2015-17 2016-18 2017-19
US NYC 2 5 4 5 8 1 3.6 4.6 5.6 4.6
France Paris NA 2 1 4 NA 1 1.5 2 2.5 1.6
Iran Tehran 1 NA NA NA 1 1 1 NA 1 1
一些三年均值包括3个数据,另一些包括2,1或0。如果考虑数据为3、2、1或0,我会在每个三年标记的旁边创建一个列,例如:
country city 2014 2015 2016 2017 2018 2019 2014-16 n. of data 14-16 2015-17 n.of data 20115-17
US NYC 2 5 4 5 8 1 3.6 3 etc etc
France Paris NA 2 1 4 NA 1 1.5 2 etc etc
Iran Tehran 1 NA NA NA 1 1 1 1 etc etc
有什么提示吗?
发布于 2020-01-30 23:19:46
您可以使用为此类任务构建的zoo
包,并基本上计算所有不是NAs的值。
library(zoo)
t(apply(df[-c(1:2)], 1, function(i)rollapply(i, 3, by = 1, function(j)sum(!is.na(j)))))
# [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8]
#[1,] 3 3 3 3 3 3 3 3
#[2,] 2 3 2 2 2 3 3 3
#[3,] 1 0 1 2 3 2 2 2
https://stackoverflow.com/questions/59988822
复制相似问题