regression相关内容

R中具有非线性外生变量的ARIMA模型

我正在 R 中进行非线性回归,并希望向我的模型添加一个移动平均项以消除残差中的自相关. 基本上,这是模型: y[n] = a + log((x1[n])^g + (x2[n])^g) + c*e[n-1] + e[n] 其中 [e] 是移动平均项. 我计划使用 ARIMA(0, 0, 1) 对残差进行建模.但是,我不知道我应该在 R 中使用哪个函数将非线性外生部分添加到 ARIMA ..
发布时间:2021-09-07 20:33:15 其他开发

如何在 Statsmodels 中获得稳健回归 (RLM) 的 R 平方?

在衡量拟合优度时 - R-Squared 似乎是对“简单"线性模型的普遍理解(并接受)的衡量标准.但是对于 statsmodels(以及其他统计软件)RLM 不包括 R 平方和回归结果.有没有办法“手动"计算它,可能类似于 Stata? 或者是否有另一种度量可以从 sm.RLS 产生的结果中使用/计算? 这是 Statsmodels 正在生成的内容: 将 numpy 导入为 np将 ..
发布时间:2021-08-30 18:51:39 Python

运行方差分析并给出 F 统计值作为输出的函数

我尝试编写的函数将获取提供的数据帧并计算 F 统计值并将其作为输出提供. 数据格式最终 颜色强度面料销售0 1 1 101 2 2 15 这里颜色、强度和面料是独立的,而销售额是相关的. def 回归():X=Final.copy()y=Final[['Sales']].copy()X_train, X_test, y_train, y_test = train_test_split( ..
发布时间:2021-07-16 20:26:17 Python

处理回归问题中分类变量的最佳方法 - python

我不确定处理回归问题的分类变量的最有效方法是什么. 我的桌子看起来像: 日期分类销售1/1/2018 鞋款 2001/2/2018 鞋款 3001/1/2018 家 100 我正在处理的问题是销售预测. 处理 Category 列的最佳方法是什么?获取假人或标签编码器?我使用了标签编码器,然后是标准定标器,但我的拟合很差.之后,我缩放了所有输入(date, category),但 ..
发布时间:2021-07-07 18:56:01 AI人工智能

如何找到将数据拆分为测试和训练的最佳值?

我正在构建一个 python 应用程序,我想在其中预测一个月内 PM2.5 的值.我正在使用多项式回归,并训练了算法将数据拆分为 30% 的测试数据和 70% 的训练数据.我正在使用这行代码来训练算法: X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42,shuffle= ..
发布时间:2021-07-07 18:55:58 Python

循环回归并以矩阵形式获取汇总统计量

我正在尝试对 25 个不同的投资组合进行类似的回归,然后找到所有 25 个回归的 R^2.显然我可以通过运行来单独完成它们 P1 25 次才能得到所有的 r.square,这真的很耗时(无法想象它是 100 还是更大).我想做一个循环,这就是我卡住的地方.这就是我所做的 sequence 返回错误 总结错误(P[i - 1])$r.squared:$ 运算符对原子向量无效另外: 警告 ..
发布时间:2021-07-07 18:55:51 其他开发

Scikit-learn R2 始终为零

我正在尝试用一个简单的 R^2 分数来测试我的 Scikit-learn 机器学习算法,但由于某种原因它总是返回零. 导入numpy从 sklearn.metrics 导入 r2_score预测 = numpy.array([0.1567, 4.7528, 1.1260, 0.2294]).reshape(1, -1)训练 = numpy.array([0, 3, 1, 0]).reshape( ..
发布时间:2021-07-07 18:55:48 其他开发

使用 lmodel2 包从简化的主轴回归模型中获取回归系数

我有一个大数据集,我正在用它进行许多回归分析.我在 r 的 lmodel2 包中使用减少的主轴回归.我需要做的是从 RMA 模型中提取回归系数(r 平方、p 值、斜率和截距).我可以使用 OLS 回归轻松完成此操作: RSQ 然后将它们导出为 .csv export 这些命令似乎不适用于 lmodel2 回归.有人知道怎么做吗? 以下是一小部分数据: xy0.440895993 2 ..
发布时间:2021-07-07 18:55:45 其他开发

gmm 估计误差

在估计具有多个自变量的 GMM 时,代码是 do_gmm 代码有效,但在输出中,我只有第一个变量,如下所示 >r(拦截)rmrf_local[1,] 0.21 -0.32[2,] 0.32 -0.04[3,] -0.43 -0.03[4,] -0.42 -0.23 我需要一些东西 >r(拦截)rmrf_local SMB_L[1,] 0.21 -0.32 0.34[2,] 0.32 ..
发布时间:2021-07-07 18:55:42 其他开发

matlab中的回归

我有这个 matlab 代码,用于带有一个独立变量的回归,但是如果我有两个独立变量(x1 和 x2)怎么办?我该如何修改这个多项式回归的代码? x = linspace(0,10,200)';% 自变量y = x + 1.5*sin(x) + randn(size(x,1),1);% 因变量A = [x.^0, x];% 构造一个排列矩阵w = (A'*A)\(A'*y);% 求解正规方程y2 ..
发布时间:2021-07-07 18:55:39 其他开发

更改 visreg2D 回归图中的颜色

在 R 中可视化回归结果的一个好方法是 visreg 包.我特别喜欢显示两种颜色不同深浅相互作用的图: 库(visreg)fit.heat (来自 visreg 文档) 使用的两种颜色是红色和蓝色. 问题 如何更改颜色?红色和蓝色的色调在黑白打印中看起来不太好,无法区分红色和蓝色.例如,我会对从蓝色到白色的比例感到满意.有没有可能做到这一点? 解决方案 您可以通过在 ..
发布时间:2021-07-07 18:55:36 其他开发

组合多重插补数据的自由度、t 统计量和 f 值

我是 R 新手用户.我安装了 Zelig 4.1-3 版和 Amelia II 1.7 版.我对如何使用 R 包和函数获得组合乘法插补数据的自由度、t 统计量和 f 值感到困惑. 首先,我加载了 Amelia 和 Zelig: require(Amelia)需要(泽利格) 然后,我加载了 Amelia 附带的示例数据: 数据(自由贸易) 我使用 amelia 函数为此数据集创建了 5 ..
发布时间:2021-07-07 18:55:32 其他开发

如何通过反复试验或 R 中更好的特定替代方法将数据集拟合到特定函数?

我有一个数据集,我想调整到以下函数并找到参数 a 和 b: 我尝试了非线性最小二乘法,但是,我想通过反复试验来尝试,使用一个带有 a 值的向量,另一个用于 b 的值,然后绘制混合这些值的所有替代方案以选择更好的拟合. 库(readxl)图书馆(ggplot2)x 看起来如果你偏离这条白线,你的身体会更差,而且你不会在白线上找到更好的地方. 相信 nls.是的,拟合看起来不太好,但这仅仅 ..
发布时间:2021-07-07 18:55:29 其他开发

具有 R 的一般混合线性模型中截距的假设检验

我有固定效应的数据:基因型 = C、E、K、M;年龄 = 30、45、60、75、90 天;随机效果:block = 1, 2, 3;和变量 = weight_DM. 文件位于:https://drive.google.com/open?id=1_H6YZbdesK7pk5H23mZtp5KhVRKz0Ozl 我有每个基因型的年龄的线性和二次方斜率,但我没有截距和标准误差.R 代码是: ..
发布时间:2021-07-07 18:55:26 其他开发

发生预测

我想知道哪种方法最适合预测事件发生.例如,给定一组来自​​ 5 年疟疾感染事件的数据以及影响这些事件的其他几个因素,我想预测未来五年的疟疾感染事件.我的想法是用模糊逻辑规则推导出一种出现因子,然后用出现因子对出现的次数进行平均得到第一个预测的出现次数,然后再用预测的出现次数对所有出现的次数进行平均,并继续对所有五个进行迭代年,但我决定在线寻求帮助. 解决方案 进行预测的方法有很多种,每种方 ..
发布时间:2021-07-07 18:55:19 其他开发

将用户定义的函数应用于数据帧

我尝试编写的函数将获取提供的数据帧并计算 F 统计值并将其作为输出提供. 数据格式最终 主要颜色强度面料销售0 1 1 101 2 2 15 这里颜色、强度和面料是独立的,而销售是相关的. 这个想法是创建一个循环,为每个唯一的键值创建一个新的数据框:并对这个数据帧执行一个函数,然后创建一个新的数据帧,它是从唯一键值获得的所有新数据帧的连接 def 回归():X=Final1.co ..
发布时间:2021-07-07 18:55:16 Python

如何将自定义函数加载到 R 中的 foreach 循环中?

我正在尝试运行具有特定空间相关结构的 gls 模型,该结构来自修改 nlme 包/从此 post(这篇文章的答案创建了允许实现相关性的新函数结构体).不幸的是,当我通过 foreach 循环运行它时,我无法让这个空间相关结构起作用: #setup 示例数据数据(“mtcars")mtcars$lon = runif(nrow(mtcars)) #include lon 和 lat 用于新的相关结 ..
发布时间:2021-07-07 18:55:09 其他开发

将列的值分隔或分组为 R 中的不同类别

大家早上好.拜托,我确实有一个问题,我已经有一段时间无法解决了.(请查看图片链接以查看我的数据集的屏幕截图) https://i.stack.imgur.com/g2eTM.jpg 我有一列数据 (status) 包含两组值(1 和 2).这些是代表回归所需的两类(或状态)因变量(例如 Pp 和 Pt)的虚拟变量. 它们的实际值包含在最后一列 Pp.Pt (Pp.Pt) 中.Pt 只是一个名 ..
发布时间:2021-07-07 18:55:06 其他开发