glmnet相关内容
我正在尝试使用glmnet包构建模型,但在运行以下行时出现以下错误: #library('glmnet') x = model.matrix(response ~ ., data = acgh_frame[,c(3:ncol(acgh_frame))]) Error: protect(): protection stack overflow 我知道这是因为我在数据帧中有大量的变量(26
..
在我的数据集中,我有许多连续变量和虚拟变量.对于 glmnet 的分析,我希望对连续变量进行标准化,而不是对虚拟变量进行标准化. 我目前手动执行此操作,首先定义一个只有 [0,1] 值的列的虚拟向量,然后在所有非虚拟列上使用 scale 命令.问题是,这不是很优雅. 但是 glmnet 有一个内置的 standardize 参数.默认情况下,这也会标准化假人吗?如果是这样,有没有一种优
..
我有一个二元结果的回归模型.我用 glmnet 拟合模型并得到选定的变量及其系数. 由于 glmnet 不计算变量重要性,我想将确切的输出(选定的变量及其系数)提供给 glm 以获取信息(标准错误等). 我搜索了 r 个文档,看来我可以在 glm 中使用“方法"选项来指定用户定义的函数.但是我没有这样做,有人可以帮助我吗? 解决方案 “问回归的标准误差是一个很自然的问题系数
..
我有这个数据集.wbh 我想使用 R 包 glmnet 来确定哪些预测变量可用于预测生育率.但是,我一直无法这样做,很可能是因为对软件包没有完全了解.生育变量是 SP.DYN.TFRT.IN.我想看看数据集中哪些预测因子对生育率的预测能力最强.我想使用 LASSO 或岭回归来缩小系数的数量,我知道这个包可以做到这一点.我只是在实施它时遇到了一些麻烦. 我知道没有代码片段需要我道歉,但我
..
我的训练数据集有大约 200,000 条记录,我有 500 个特征.(这些是来自零售组织的销售数据).大多数特征为 0/1 并存储为稀疏矩阵. 目标是预测购买大约 200 种产品的概率.因此,我需要使用相同的 500 个特征来预测 200 种产品的购买概率.由于 glmnet 是模型创建的自然选择,因此我考虑为 200 个产品并行实施 glmnet.(因为所有 200 个模型都是独立的)但我
..
我正在使用 glmnet 在插入符号中运行弹性网络正则化. 我将值序列传递给 trainControl 用于 alpha 和 lambda,然后我执行 repeatedcv 以获得 alpha 和 lambda 的最佳调整. 这是一个示例,其中 alpha 和 lambda 的最佳调整分别为 0.7 和 0.5: age 最佳 lambda 是: model.test$fina
..
我正在使用 glmnet R 包运行 Ridge 回归.我注意到我从 glmnet::glmnet 函数获得的系数与我通过定义计算系数获得的系数不同(使用相同的 lambda 值).有人能解释一下为什么吗? 数据(包括响应Y 和设计矩阵X)被缩放. 库(MASS)图书馆(glmnet)# 数据维度p.tmp 请注意,我在调用 cv.glmnet(或 glmnet)时设置了 interc
..
我想知道是否可以从 GLMNet 获取 AIC 和 BIC.我发现 glmnet.cr 似乎能够做到,但我的反应是时间,而不是顺序.我可以根据可能性自己计算它,但 glmnet 也不会返回. 切线:我真的可以返回 l1norm 吗?我觉得应该是 fit$norm 但似乎不是.(我知道它说不要把数字拉出来,但我实际上没有使用 R) 预先感谢您的帮助. 解决方案 我在如何计算
..
我正在尝试使用 LASSO 进行变量选择,并尝试使用 glmnet 包在 R 中实现.这是我目前写的代码: set.seed(1)图书馆(glmnet)return = matrix(ret.ff.zoo[which(index(ret.ff.zoo) == beta.df$date[1]),])数据 = 矩阵(unlist(beta.df[which(beta.df$date == beta
..
我在 glmnet 中使用以下代码: >图书馆(glmnet)>fit = glmnet(as.matrix(mtcars[-1]), mtcars[,1])>情节(适合,xvar='lambda') 但是,我想打印出最好的 Lambda 系数,就像在岭回归中所做的那样.我看到以下拟合结构: >力量(适合)12人名单$ a0 : 名为 num [1:79] 20.1 21.6 23.2 24
..
我想计算 R 中 glmnet 模型的变量重要性.我使用 glmnet 包来拟合弹性网络模型,如 库(glmnet)图书馆(插入符号)图书馆(贵宾)data_y
..
我的问题 我想建立一个具有高 AUC 的逻辑回归模型来预测二元变量. 我想使用以下方法(如果可行): 使用弹性网络模型 (glmnet) 减少预测变量并找到最佳超参数(alpha 和 lambda) 在逻辑回归模型 (=finalmodelsuperdoc 的意见)相结合/code>),类似于第 26 页中所述: Afshar P、Mohammadi A、Platan
..
在 Caret 中使用 glmnet 时出错 下面的例子加载库 库(dplyr)图书馆(插入符号)图书馆(C50) 从库 C50 加载流失数据集 数据(流失) 创建 x 和 y 变量 churn_x 使用 createFolds() 在目标变量 churn_y 上创建 5 个 CV 折叠 myFolds 创建 trainControl 对象:myControl myC
..
我修改了这篇文章中的函数(在曲线在 Glmnet 图中 R )添加图例,如下所示: 库(glmnet)fit = glmnet(as.matrix(mtcars[-1]), mtcars[,1])lbs_fun
..
目前我正在使用 glmnet 包来运行套索回归(在下面的示例中,它被保存到“fits"变量中.然后当我绘制 fits 变量时,它会正确出现,但系数标签非常小.有什么想法可以增加这些的大小吗? 下面可重现的示例... require(glmnet)#setup 样本 DF 有 5 个变量set.seed(123)sampleDF
..
我用R语言编写了这个套索代码,并得到了一些beta值: #Lasso图书馆(MASS)图书馆(glmnet)波士顿= na.omit(波士顿)x = model.matrix(crim〜.,Boston)[,-1]行名(x)= c()y = as.matrix(Boston $ crim)lasso.mod = glmnet(x,y,alpha = 1,lambda = 0.1)beta =
..
我正在尝试使用glmnet软件包进行功能选择.我已经要运行glmnet.但是,我很难理解输出.我的目标是获取基因列表及其各自的系数,这样我就可以根据基因在分隔两组标签中的相关性来对基因列表进行排名. x = manual_normalized_melt [,colnames(manual_normalized_melt)%in%sig_0_01_ROTS $ Gene]y = cellID_r
..
为什么从glmnet包中的glmnet函数中不能仅将一个解释变量传递给glmnet函数中的模型? 代码和错误如下: > modelX summary(modelX) Call: glm(formula = ifelse(train$cliks
..
我有一个带有二进制结果的回归模型.我用glmnet拟合了模型,并获得了选定的变量及其系数. 由于glmnet不会计算变量的重要性,因此我想将确切的输出(选定的变量及其系数)提供给glm,以获取信息(标准错误等). 我搜索了r个文档,看来我可以在glm中使用“方法"选项来指定用户定义的功能. 但是我没有这样做,有人可以帮我吗? 解决方案 “问回归的标准误差是一个很自然的问题
..
在过去的几个月中,我从事了许多项目,其中使用glmnet包来拟合弹性网模型.很棒,但是与大多数R建模函数相比,该界面是一个基本系统.特别是,您不必指定公式和数据框,而必须提供响应向量和预测变量矩阵.您还会失去常规界面所提供的许多生活质量方面的东西,例如对因素的明智(?)处理,缺失值,将变量置于正确的顺序等. 因此,我通常最终以编写自己的代码来重新创建公式/数据框接口.由于客户机密性问题,我也
..