使用 rollapply 和 zoo 计算一列变量的滚动平均值 [英] use rollapply and zoo to calculate rolling average of a column of variables

查看:53
本文介绍了使用 rollapply 和 zoo 计算一列变量的滚动平均值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想计算sp"列中所有变量的滚动平均值.这是我的数据示例:

I want to calculate the rolling mean for all variables in column "sp". This is a sample of my data:

the_date    sp  wins
01-06--2012 1   305
02-06--2012 1   276
03-06--2012 1   184
04-06--2012 1   248
05-06--2012 1   243
06-06--2012 1   363
07-06--2012 1   272
01-06--2012 2   432
02-06--2012 2   369
03-06--2012 2   302
04-06--2012 2   347
05-06--2012 2   357
06-06--2012 2   331
07-06--2012 2   380
01-06--2012 3   1
02-06--2012 3   2
03-06--2012 3   3
04-06--2012 3   2
05-06--2012 3   0
06-06--2012 3   2
07-06--2012 3   0

我想要的是在数据中添加一列,为每个 sp 提供超过 3 天的移动平均值.所以以下输出是我想要的:

What I want, is to have a column added to data, that gives the moving average over 3 days for each sp. So the following output is what I desire:

the_date    sp  wins    SMA_wins
01-06--2012 1   305     305.00
02-06--2012 1   276     290.50
03-06--2012 1   184     255.00
04-06--2012 1   248     236.00
05-06--2012 1   243     225.00
06-06--2012 1   363     284.67
07-06--2012 1   272     292.67
01-06--2012 2   432     432.00
02-06--2012 2   369     400.50
03-06--2012 2   302     367.67
04-06--2012 2   347     339.33
05-06--2012 2   357     335.33
06-06--2012 2   331     345.00
07-06--2012 2   380     356.00
01-06--2012 3   1       1.00
02-06--2012 3   2       1.50
03-06--2012 3   3       2.00
04-06--2012 3   2       2.33
05-06--2012 3   0       1.67
06-06--2012 3   2       1.33
07-06--2012 3   0       0.67

我正在使用 rollapply.

I am using rollapply.

df <- group_by(df, sp)
df_zoo <- zoo(df$wins, df$the_date) 
mutate(df, SMA_wins=rollapplyr(df_zoo, 3, mean,  align="right", partial=TRUE))

如果我在特定的 sp 上过滤我的数据,它会完美运行.

If I filter my data on a specific sp, it works perfectly.

当我按 sp 分组时,我怎样才能使这个工作?

How can I make this work when I group by sp?

谢谢

推荐答案

你可以这样做:

library(dplyr)
library(zoo)

df %>% group_by(sp) %>%
       mutate(SMA_wins=rollapplyr(wins, 3, mean, partial=TRUE))

看起来您在 mutate 调用中使用 dfdf_zoo 把事情搞砸了.

It looks like your use of df and df_zoo in your mutate call was messing things up.

这篇关于使用 rollapply 和 zoo 计算一列变量的滚动平均值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆