用R计算季节平均值最优雅的方法是什么? [英] What is the most elegant way to calculate seasonal means with R?
本文介绍了用R计算季节平均值最优雅的方法是什么?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有均匀间隔的时间序列和每日平均观测数据。
如何以最简单的方式计算季节平均值?季节应遵循DJF(=冬季:12月、1月、2月)、MAM、JJA和SON的气象命名法。
这意味着12月份的值来自年份x-1。
月平均值的计算方法如下: How to calculate a monthly mean?
在计算季节平均值时,可以遵循这一思想。然而,有几个警告使它不太透明,必须小心!
我还在前一个帖子中处理了这个问题的一小部分:How to switch rows in R?
下面是完整的故事:
0:随机生成时间序列
ts.pdsi <- data.frame(date = seq(
from=as.Date("1901-01-01"),
to=as.Date("2009-12-31"),
by="day"))
ts.pdsi$scPDSI <- rnorm(dim(ts.foo)[1], mean=1, sd=1) # add some data
1:使用SEA包并向您的时间序列添加季节,必须将其格式化为data.Frame。
library(seas)
# add moth/seasons
ts.pdsi$month <- mkseas(ts.pdsi,"mon") # add months
ts.pdsi$seas <- mkseas(ts.pdsi,"DJF") # add seasons
ts.pdsi$seasyear <- paste(format(ts.pdsi[,1],"%Y"),
ts.pdsi$seas ,sep="") # add seasyears, e.g. 1950DJF
这给了
> head(ts.pdsi)
date scPDSI month seas seasyear
1 1901-01-01 -0.10881074 Jan DJF 1901DJF
2 1901-02-01 -0.22287750 Feb DJF 1901DJF
3 1901-03-01 -0.12233192 Mär MAM 1901MAM
4 1901-04-01 -0.04440915 Apr MAM 1901MAM
5 1901-05-01 -0.36334082 Mai MAM 1901MAM
6 1901-06-01 -0.52079030 Jun JJA 1901JJA
2:然后您可以使用$seasYear列按照上述方法计算季节平均值
> MEAN <- tapply(pdsi$scPDSI, ts.pdsi$seasyear, mean, na.rm = T)
> head(MEAN)
1901DJF 1901JJA 1901MAM 1901SON 1902DJF 1902JJA
-0.45451556 -0.72922229 -0.17669396 -1.12095590 -0.86523850 -0.04031273
注意:由于严格按字母顺序排序,春季(MAM)和夏季(JJA)被切换。
第3个:切换回来
foo <- MEAN
for(i in 1:length(MEAN)) {
if (mod (i,4) == 2) {
foo[i+1] <- foo[i] #switch 2nd 3rd row (JJA <-> MAM)
foo[i] <- MEAN[i+1]
}
}
# and generate new names for the array
d <- data.frame(date=seq(from=as.Date("1901-01-01"), to=as.Date("2009-12-31"), by="+3 month"))
d$seas <- mkseas(d,"DJF")
d$seasyear <- paste(format(d[,1],"%Y"), d$seas ,sep="")
names(foo)<-d$seasyear # add right order colnames
MEAN <-foo
最后,这导致了季节性平均值的时间序列。嗯,我发现它太复杂了,我想有更简单的解决方案。
此外,这个解决方案对于冬季DJF也有一个真正的主要问题:到目前为止,12月份并不是从前一年中选择的。这是相当容易解决的(我想),但给出的方式前夕更复杂。我真的希望周围有更好的主意!
推荐答案
这是您想要的吗?
# # create some data: daily values for three years
df <- data.frame(date = seq(from = as.Date("2007-01-01"),
to = as.Date("2009-12-31"),
by = "day"))
df$vals <- rnorm(nrow(df))
# add year
df$year <- format(df$date, "%Y")
# add season
df$seas <- mkseas(x = df, width = "DJF")
# calculate mean per season within each year
df2 <- aggregate(vals ~ seas + year, data = df, mean)
df2
# seas year vals
# 1 DJF 2007 -0.048407610
# 2 MAM 2007 0.086996842
# 3 JJA 2007 0.013864555
# 4 SON 2007 -0.081323367
# 5 DJF 2008 0.170887946
# 6 MAM 2008 0.147830260
# 7 JJA 2008 0.003008866
# 8 SON 2008 -0.057974215
# 9 DJF 2009 -0.043437437
# 10 MAM 2009 -0.048345979
# 11 JJA 2009 0.023860506
# 12 SON 2009 -0.060076870
由于mkseas
将日期转换为具有所需顺序级别的季节性因素,因此在汇总年份和季节后,该顺序也是正确的。
这篇关于用R计算季节平均值最优雅的方法是什么?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文