具有多个独立分组的线性回归预测 [英] Predict linear regression with multiple separate groups

查看:13
本文介绍了具有多个独立分组的线性回归预测的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想从单个数据帧中的多个组的线性回归中预测值。 我找到了下面这篇博文,它几乎满足了我的所有需求:https://www.r-bloggers.com/2016/09/running-a-model-on-separate-groups/

但是,我不能将其与带有newdata的recast()函数结合使用。 对于一个组,我使用以下内容:

m <- lm(y ~ x, df)
new_df <- data.frame(x=c(5))
predict(m, new_df)

这给出了x=5时y的预测值。

当我的DF中有多个组时,如何执行此操作?这就是我尝试的内容:

df %>%
    nest(-group) %>%
    mutate(fit = map(data, ~ lm(.$y ~ .$x)),
           results = map(fit, predict)) %>%
    unnest(results)

当我尝试使用RESULTS=MAP(FIT,Predicate(New_Df))时,我只得到一个错误。有没有办法将x的值(在本例中为5)传递到上面的代码中?

理想情况下,我将获得一个新的data.frame,它包含两列,GROUP和预测的y值。

这是示例数据。帧:

group   x   y
g1  1   2
g1  1.5 3
g1  2   4
g1  2.3 4.4
g1  3   6
g1  3.4 6.2
g1  4.11    7
g1  4.8 7.9
g1  5   8
g1  5.3 8.2
g2  2   5
g2  2.3 4
g2  4   2.2
g2  4.4 1.9
g2  7   0.3

编辑:

使用ggplot2绘制样例数据,得到如下图:

ggplot(df, aes(x,y,colour=group)) +
 geom_point() +
 stat_smooth(method="lm", se=FALSE)

使用以下代码,我得到了需要的预测y值:

predict(lm(y ~ x, df[df$group =="g1", ]), new_df)
       1 
8.180285 

predict(lm(y ~ x, df[df$group =="g2", ]), new_df)
       1 
1.732136 

我要生成一个新的数据帧,它应该如下所示,并包含x=5处的预测y值:

group   y_predict  
g1  8.180285  
g2  1.732136

推荐答案

这是使用lapply函数的完美案例。试试这个:

linear_model <- function(x) lm(y ~ x, x)
m <- lapply(split(df,df$group),linear_model)
现在,您有listlinear models。让我们使用它为所有模型预测new_df的y值:

new_df <- data.frame(x=c(5))
my_predict <- function(m) predict(m,new_df)
sapply(m,my_predict)

输出:

#     g1.1     g2.1 
# 8.180285 1.732136

输出是numeric带名称的类。

这篇关于具有多个独立分组的线性回归预测的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆