识别r中的回归样本 [英] Identify regression sample in r
本文介绍了识别r中的回归样本的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个一般性的问题。有没有什么办法可以标识(或标记)R中回归中使用的观测数据?
lligator = data.frame(lnLength = c(3.87, 3.61, NA, 3.43, 3.81, 3.83, 3.46, 3.76,
3.50, 3.58, 4.19, 3.78, 3.71, 3.73, 3.78),lnWeight = c(4.87, 3.93, 6.46, 3.33, 4.38, 4.70, 3.50, 4.50,NA, 3.64, 5.90, 4.43, 4.38, 4.42, 4.25))
t.test=lm(lnWeight ~ lnLength, data = alligator)
我想创建一个包含另一列的数据框,以指示使用的是哪个观测。我知道怎么
na.omit()
和
na.exclude()
和
.completecases
工作,我可以使用它们来进行回归。但我正在寻找的是一种方法,可以创建一个指示器来显示使用了哪个观察。对于Stata用户,类似于e(示例)
推荐答案
如果我理解正确的话,您可以使用na.action()
来检索回归过程中被排除的索引的向量,并用它来计算一个指示变量:
alligator$used <- !seq_len(nrow(alligator))%in%na.action(t.test);
alligator;
## lnLength lnWeight used
## 1 3.87 4.87 TRUE
## 2 3.61 3.93 TRUE
## 3 NA 6.46 FALSE
## 4 3.43 3.33 TRUE
## 5 3.81 4.38 TRUE
## 6 3.83 4.70 TRUE
## 7 3.46 3.50 TRUE
## 8 3.76 4.50 TRUE
## 9 3.50 NA FALSE
## 10 3.58 3.64 TRUE
## 11 4.19 5.90 TRUE
## 12 3.78 4.43 TRUE
## 13 3.71 4.38 TRUE
## 14 3.73 4.42 TRUE
## 15 3.78 4.25 TRUE
等效但可能更快的方法:
alligator$used <- TRUE;
alligator$used[na.action(t.test)] <- FALSE;
这篇关于识别r中的回归样本的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文