具有多个独立分组的线性回归预测 [英] Predict linear regression with multiple separate groups
本文介绍了具有多个独立分组的线性回归预测的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我想从单个数据帧中的多个组的线性回归中预测值。 我找到了下面这篇博文,它几乎满足了我的所有需求:https://www.r-bloggers.com/2016/09/running-a-model-on-separate-groups/
但是,我不能将其与带有newdata的recast()函数结合使用。 对于一个组,我使用以下内容:m <- lm(y ~ x, df)
new_df <- data.frame(x=c(5))
predict(m, new_df)
这给出了x=5时y的预测值。
当我的DF中有多个组时,如何执行此操作?这就是我尝试的内容:df %>%
nest(-group) %>%
mutate(fit = map(data, ~ lm(.$y ~ .$x)),
results = map(fit, predict)) %>%
unnest(results)
当我尝试使用RESULTS=MAP(FIT,Predicate(New_Df))时,我只得到一个错误。有没有办法将x的值(在本例中为5)传递到上面的代码中?
理想情况下,我将获得一个新的data.frame,它包含两列,GROUP和预测的y值。
这是示例数据。帧:
group x y
g1 1 2
g1 1.5 3
g1 2 4
g1 2.3 4.4
g1 3 6
g1 3.4 6.2
g1 4.11 7
g1 4.8 7.9
g1 5 8
g1 5.3 8.2
g2 2 5
g2 2.3 4
g2 4 2.2
g2 4.4 1.9
g2 7 0.3
编辑:
使用ggplot2绘制样例数据,得到如下图:
ggplot(df, aes(x,y,colour=group)) +
geom_point() +
stat_smooth(method="lm", se=FALSE)
使用以下代码,我得到了需要的预测y值:
predict(lm(y ~ x, df[df$group =="g1", ]), new_df)
1
8.180285
predict(lm(y ~ x, df[df$group =="g2", ]), new_df)
1
1.732136
我要生成一个新的数据帧,它应该如下所示,并包含x=5处的预测y值:
group y_predict
g1 8.180285
g2 1.732136
推荐答案
这是使用lapply
函数的完美案例。试试这个:
linear_model <- function(x) lm(y ~ x, x)
m <- lapply(split(df,df$group),linear_model)
现在,您有list
的linear models
。让我们使用它为所有模型预测new_df
的y值:
new_df <- data.frame(x=c(5))
my_predict <- function(m) predict(m,new_df)
sapply(m,my_predict)
输出:
# g1.1 g2.1
# 8.180285 1.732136
输出是numeric
带名称的类。
这篇关于具有多个独立分组的线性回归预测的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文