gbm相关内容
我在理解 R 的 gbm 梯度提升机器包中的树的结构时遇到了一些困难.具体来说,查看 pretty.gbm.tree 的输出 SplitVar 中的索引指向哪些特征? 我在一个数据集上训练了一个 GBM,这是我的一棵树的顶部~四分之一——调用 pretty.gbm.tree 的结果: SplitVar SplitCodePred LeftNode RightNode MissingNod
..
我使用H2o库运行模型.我进行了5折交叉验证. 模型= H2OGradientBoostingEstimator(balance_classes =真实,nfolds = 5,keep_cross_validation_fold_assignment =正确,种子= 1234)model.train(x =预测变量,y =响应,training_frame =数据)print('rmse:',m
..
我正在使用插入符号包运行gbm模型,并尝试通过对doredis包进行并行处理来使其工作.我可以让后端工作人员全部正常运行,但是当他们重新组合到最终模型中时遇到了问题.我收到此错误: foreach中的错误(j = 1:12,.combine = sum,.multicombine = TRUE)%dopar%:分配目标扩展为非语言对象 这是我第一次尝试运行foreach循环(更不用说像gb
..
我在 R 中使用 gbm 包,并应用"bernoulli"选项进行分发以构建分类器,并且得到了"nan"和“无法预测任何分类结果.但是当我使用"adaboost"时,我没有遇到相同的错误.下面是示例代码,我用虹膜数据集复制了相同的错误. ##使用gbm的虹膜数据图书馆(插入符号)图书馆(GBM)数据(虹膜)数据
..
在很多情况下,尝试拟合gbm或rpart模型时,都会出现此错误.最终,我能够使用公开可用的数据一致地重现它.我注意到使用CV(或重复的Cv)时会发生此错误.当我不使用任何健身控件时,我不会收到此错误.有人能阐明为什么我总是不断出错的情况吗? fitControl= trainControl("repeatedcv", repeats=5) ds = read.csv("http://www.
..
有人熟悉如何弄清楚R中gbm模型内部的情况吗? 比方说,我们想看看如何预测虹膜中的Petal.Length.为了简单起见,我运行了: tg=gbm(Petal.Length~.,data=iris) 这可行,并且在您运行时: summary(tg) 然后您得到: Hit to see next plot:
..
(示例是从我有这个例子: library("AppliedPredictiveModeling") library("caret") data("AlzheimerDisease") data
..
我一直在通过插入符号使用 gbm ,但是没有问题,但是从数据框中删除一些变量时,它开始失败.我已经尝试过上述软件包的github版本和cran版本. 这是错误: > fitRF = train(my_data[trainIndex,vars_for_clust], clusterAssignment[trainIndex], method = "gbm", verbose=T) Som
..
我正在使用R中gbm包中的多项式分布.当我使用predict函数时,会得到一系列值: 5.086328 -4.738346 -8.492738 -5.980720 -4.351102 -4.738044 -3.220387 -4.732654 但是我想获得每个班级发生的概率.我如何找回概率?谢谢. 解决方案 看看?predict.gbm,您将看到该函数有一个“类型"参数.试用pr
..
我很难理解R的gbm梯度增强机器包中树木的结构.具体来说,请查看pretty.gbm.tree SplitVar中的哪些索引指向的功能? 我在数据集上训练了一个GBM,这是我的一棵树的顶部〜四分之一-调用pretty.gbm.tree的结果: SplitVar SplitCodePred LeftNode RightNode MissingNode ErrorReduction
..
我正在使用gbm预测二进制响应. 当我设置cv.folds = 0时,一切正常.但是,当cv.folds> 1时,当交叉验证的第一个刺激完成时,出现错误:Error in object$var.levels[[i]] : subscript out of bounds.有人说这可能是因为某些因子变量在训练或测试数据中缺少水平,但是我尝试仅使用数字变量仍然会出现此错误. > gbm.fit
..
从h2o的RF和GBM模型中寻找类似于rlink,H2O的Flow或本地html页面中树的有效方法,类似于下面链接中的图像. 具体来说,如何通过解析h2o.download_pojo(rf1)或h2o.download_pojo(gbm1)为下面的代码生成的对象(拟合模型)rf1和gbm2绘制树? # # The following two commands remove any previ
..
我在H2O中通过R代码运行了GBM模型,但出现了以下错误.相同的代码运行了好几个星期.想知道这是H2O方面的错误还是在用户系统上进行的配置? water.exceptions.H2OModelBuilderIllegalArgumentException:GBM模型的非法参数:gbm-2017-04-18-15-29-53.详细信息:字段上的ERRR:_ntrees:树模型将不适合驱动程序节
..
我使用H2O版本3.26.0.5在二进制问题中训练了GBM模型,以预测肯定分类的可能性.我将模型文件另存为MOJO,并使用该文件在新数据中生成了预测: ## first, restart R session ## # load the model library(h2o) h2o.init(nthreads = -1) model
..
我目前正在探索dismo包中的gbm函数,以创建用于物种分布建模的增强回归树.我一直在使用dismo渐晕和Elith等人于2008年发表在《动物生态学杂志》上的论文“增强回归树的工作指南".在Elith等人的第808:809页上.在本文中,作者解释了部分依赖图,并在809页的底部给出了一个示例(图6).根据Dismo小插图“用于生态建模的增强回归树",gbm.plot“绘制响应对一个或多个预测变量
..
是否存在用于在R中导出gbm模型的标准(或可用)方法? PMML可以工作,但是当我尝试使用pmml库时,也许是错误地,我得到了一个错误: 例如,我的代码与此类似: library("gbm") library("pmml") model
..
更新: 我已经尝试在 https://rdrr.io/snippets/上运行代码,并且效果很好.因此,我怀疑我的R安装有问题,但是非常担心这种情况会在没有错误或警告的情况下发生.对此进行调查的最佳步骤是什么?我在Ubuntu 18.04和gbm 2.1.4上运行R 3.4.4 我正在将增强模型拟合到数据集,并注意到一些奇怪的预测.这是一个最小的工作示例.请注意,这只是我正在使用的数据
..
我正在尝试使用带h2o的GBM解决分类问题,以代替逻辑回归(GLM).数据中的非线性和相互作用使我认为GBM更合适. 我已经运行了基准GBM(请参见下文),并将AUC与Logistic回归的AUC进行了比较. GBM的性能要好得多. 在经典的线性逻辑回归中,人们将能够看到每个预测变量(x)对结果变量(y)的方向和影响. 现在,我想以相同的方式评估估算GBM的可变重要性. 一
..
我的响应是一个分类变量(某些字母),因此我在建立模型时使用了distribution ='multinomial',现在我想预测响应并根据这些字母而不是概率矩阵来获取输出 但是在predict(model, newdata, type='response')中,它给出的概率与type='link'的结果相同. 有没有办法获得分类输出? BST = gbm(V1~.,data=tr
..
我想用H2O建立GBM模型.我的数据集不平衡,所以我正在使用balance_classes参数.对于网格搜索(参数调整),我想使用5倍交叉验证.我想知道在这种情况下H2O如何处理类平衡.只有训练倍数会重新平衡吗?我想确保测试折叠不重新平衡. 谢谢. 解决方案 在类不平衡设置中,人为地平衡测试/验证集没有任何意义:这些集必须保持 realistic ,即您想要在现实世界中测试分类器的性
..