regression相关内容
我正在使用 glmnet R 包运行 Ridge 回归.我注意到我从 glmnet::glmnet 函数获得的系数与我通过定义计算系数获得的系数不同(使用相同的 lambda 值).有人能解释一下为什么吗? 数据(包括响应Y 和设计矩阵X)被缩放. 库(MASS)图书馆(glmnet)# 数据维度p.tmp 请注意,我在调用 cv.glmnet(或 glmnet)时设置了 interc
..
我有一个需要执行偏最小二乘回归的 Java 应用程序.似乎没有 PLSR 的 Java 实现.Weka 可能在某个时候有类似的东西,但它不再在 API 中.另一方面,我发现了一个很好的 R 实现,它有一个额外的好处.它被我想要复制其结果的人使用,这意味着由于 PLSR 实施方式的差异而出错的可能性较小. 问题是:是否有足够好的(且易于使用)包使 Java 能够调用 R,将一些参数传递给函数并
..
我正在尝试建立一个模型来预测房价. 我有一些功能 X(浴室数量等)和目标 Y(范围在 300,000 美元到 800,000 美元之间) 在将 Y 拟合到模型之前,我使用了 sklearn 的 Standard Scaler 对其进行了标准化. 这是我的 Keras 模型: def build_model():模型 = 顺序()model.add(Dense(36, input
..
当损失函数为均方误差时,Accuracy 是如何定义的?是平均绝对百分比误差吗? 我使用的模型具有输出激活线性,并使用loss= mean_squared_error 编译 model.add(Dense(1))model.add(Activation('linear')) # numbermodel.compile(loss='mean_squared_error', 优化器='ada
..
我有两个数据数组作为高度和重量: import numpy as np, matplotlib.pyplot as plt高度 = np.array([50,52,53,54,58,60,62,64,66,67,68,70,72,74,76,55,50,45,65])权重 = np.array([25,50,55,75,80,85,50,65,85,55,45,45,50,75,95,65,50
..
我正在尝试运行 96 个回归并将结果保存为 96 个不同的对象.更复杂的是,我希望模型中协变量之一的下标也更改 96 次.我几乎解决了这个问题,但不幸的是我碰壁了.到目前为止的代码是, for(i in 1:96){分配(粘贴(“z.out",i,sep =“"),lm(rMonExp_EGM~TE_i + Month2+Month3+Month4+Month5+Month6+Month7+Mo
..
我使用 tensorflow 来实现一个简单的多层回归感知器.代码是从标准 mnist 分类器修改而来的,我只将输出成本更改为 MSE(使用 tf.reduce_mean(tf.square(pred-y))),以及一些输入、输出大小设置.但是,如果我使用回归训练网络,经过几个时期后,输出批次完全相同.例如: 目标:48.129,估计:42.634目标:46.590,估计:42.634目标:34
..
如果我在回归中使用二元解释变量,如何告诉 R 使用某个级别作为参考? 它只是默认使用某个级别. lm(x ~ y + as.factor(b)) 与 b {0, 1, 2, 3, 4}.假设我想使用 3 而不是 R 使用的零. 解决方案 参见 relevel() 函数.下面是一个例子: set.seed(123)x 现在使用 relevel() 函数更改 DF 中的因子 b
..
我是 R 的新手,我想使用 *apply 函数改进以下脚本(我已经阅读了关于 apply,但我无法使用它).我想对多个自变量(数据框中的列)使用 lm 函数.我用过 for (i in (1:3) {分配(paste0('lm.',names(data[i])),lm(formula=formula(i),data=data))} Formula(i) 定义为 公式=函数(x){as.for
..
这是我正在使用的所有变量: str(ad.train)$ Date : Factor w/427 levels "2012-03-24","2012-03-29",..: 4 7 12 14 19 21 24 29 31 34 ...$ Team : Factor w/18 levels "Adelaide","Brisbane Lions",..: 1 1 1 1 1 1 1 1 1 1 ..
..
我有数据: dat 每列提供一组数据.我使用组索引变量: group 当我尝试命令时出现错误 fit
..
2D 数据的曲线拟合问题是众所周知的(LOWESS 等),但给定一组 3D 数据点,我如何将 3D 曲线(例如平滑/回归样条)拟合到该数据? 更多:我试图找到一条曲线,拟合由没有已知关系的向量 X、Y、Z 提供的数据.本质上,我有一个 3D 点云,需要找到 3D 趋势线. MORE:对于含糊不清,我深表歉意.我尝试了几种方法(我还没有尝试修改线性拟合),随机神经网络似乎效果最好.即,我
..
为了明确我的要求,我创建了一个简单的示例.第一步是创建一些数据: gender 所以这些是合并到一个 data.frame 的一些随机日期.所以从这些日期开始,我想绘制一个云,在那里我可以区分男性和女性,并在其中添加两个简单的回归(一个用于女性,一个用于男性).所以我已经开始了,但我无法达到我想要的地步.请看下面我到目前为止所做的: require(格子)云(y$死亡~y$药物数量*遗传值
..
我正在使用 rdd(回归不连续性设计)包的 DCdensity 函数,并想更改绘图的外观.我转到此函数的帮助文件,在 plot 下找到以下内容:“用户可以将此函数包装在其他图形选项中以修改绘图."我怎样才能在实践中做到这一点? 我注意到我的问题与 rdd::DCdensity 中的 R 绘图选项相同.但是,这个老问题的一个答案对我来说并不令人满意,因为我不想更改全局绘图选项,而是想针对每个应
..
我有一个结构如下的数据框: birthwt烟草01 pscore pscoreblocks3425 0 0.18 (0.177, 0.187]3527 1 0.15 (0.158, 0.168]1638 1 0.34 (0.335, 0.345] birthwt 列是以克为单位测量出生体重的连续变量.烟草 01 列包含 0 或 1 的值. pscore 列包含 0 和 1 之间的概率值. ps
..
我有数据: dat 每列提供一组数据.我使用组索引变量: group 当我尝试命令时出现错误 fit
..
包含一个或多个因子变量的多变量回归模型的 R 输出不会自动包含模型中整个因子变量显着性的似然比检验 (LRT).例如: fake = data.frame( x1=rnorm(100), x2=sample(LETTERS[1:4],大小=100,替换=真),y=范数(100))头(假)x1 x2 y1 0.6152511 A 0.76824672 -0.8215727 A -0.5389245
..
假设我们有一个玩具数据框: x 我想构建一个模型矩阵 # x1b x1c x2B x2C# 1 0 0 0 0# 2 0 0 0 0# 3 1 0 1 0# 4 1 0 1 0# 5 0 1 0 1# 6 0 1 0 1 作者: model.matrix(~ x1 + x2 - 1, data = x,对比.arg = list(x1 = contr.treatment(letters
..
考虑下表: DB 我想用两个没有截距的二元变量(TRUE 或 FALSE)来解释我的定量变量 Y. 这个选择的论点是,在我的研究中,我们不能同时观察到X1=FALSE和X2=FALSE,所以它不对于这个水平,有一个不为 0 的均值是有意义的. 带拦截 m1 |t|)(拦截) -1.9684 1.0590 -1.859 0.1600X1TRUE 0.7358 0.9032 0.8
..
我正在尝试在 R 中运行 anova() 并且遇到了一些困难.这是我迄今为止所做的,以帮助阐明我的问题. 这是到目前为止我的数据的 str(). str(mhw)'data.frame':500 个观察.共 5 个变量:$ r : int 1 2 3 4 5 6 7 8 9 10 ...$ c : int 1 1 1 1 1 1 1 1 1 1 ...$ 谷物:数量 3.63 4.07
..