xgboost相关内容

在损失函数中调整XgBoost中预测类别的权重

是否可以调整给定目标的加权误差?我试图做的是在预测多类时,对较稀有类的损失进行更高的加权。 推荐答案 如果使用核心数据结构,可以通过“Set_Weight”参数设置标签的权重: set_weight(Weight)设置每个实例的权重。 参数:权重(类似数组)-每个数据点的权重 虽然关于这个主题的文档相当平淡,但我找到了一个可能对上一个主题有用的合理答案:How is ..
发布时间:2022-09-04 17:01:05 其他开发

R中的xgBoost中的人类可读规则

我尝试在R中使用xgBoost从我的数据中获取规则(Gbtree),这样我就可以在其他系统中使用这些规则(而不是带有‘Forecast’的预测数据)。输入数据具有很高的可信度。包含二进制稀疏数据的1500列和40 MIO行,标签也是二进制列。 library(xgboost) library(Matrix) labels ..
发布时间:2022-09-04 16:52:42 其他开发

XGBoost-国家/地区功能应该是标签还是热编码?

我们的模型中有一个国家的特征,我们对它使用了标签编码器,例如: BEL-1, US-2, ENG-3, 等... XGBoost模型的最佳实践是将其用作数字还是对其执行一次热编码? 谢谢, TAL 推荐答案 没有黄金标准。 OHE更安全,因为它不会给类别引入人为的秩序。不利的一面是,它增加了具有多个唯一值的功能的内存占用,树可能会在数字功能上的拆分和如此多 ..
发布时间:2022-09-04 16:49:30 其他开发

在可执行文件中运行XgBoost时出现问题

我正在使用用PyInstaller创建的可执行文件中保存的Xgboost模型。我设置了一个虚拟环境并下载了Xgboost并确保其运行,但在创建可执行文件并运行可执行文件后,我收到关于xgboost.core的错误: ModuleNotFoundError: No module nemed 'xgboost.core' 推荐答案 实际上我看不出xgBoost有任何导入问题,首先,请 ..
发布时间:2022-09-04 16:42:19 其他开发

如果我使用不同数量的内核,XGBoost会产生相同的结果吗?

我在两台计算机上安装了完全相同的XGBoost(0.4)版本。这两台机器之间唯一的区别是内存和核心数量(8比16)。 使用完全相同的数据,我不能重现相同的结果。它们略有不同(第四、第五位小数)。 种子保留为默认值。 推荐答案 它是高度特定于实现的,但在一般的随机化算法中,并行RAN在使用不同数量的内核时可能会有不同的行为(除非强制随机数生成器同步,这将减慢进程)。因此,人们应该预料到这 ..
发布时间:2022-09-04 16:22:47 AI人工智能

XGBoost-Sklearn上的弃用警告

我使用的是XGBoost中的XGBArtifier()。我收到以下不推荐使用的警告。 是否有解决方案可以消除此警告? /home/carnd/anaconda3/envs/dl/lib/python3.5/site-packages/sklearn/cross_validation.py:44: DeprecationWarning: This module was deprecate ..
发布时间:2022-09-04 16:18:41 其他开发

如何用多线程在OSX上安装XGBoost

我正在尝试按照指南here在我的Mac(OSX 10.12.1)上安装xgBoost,但遇到了一些问题。 第1步 通过brew install gcc --without-multilib获取支持OpenMP的GCC-6.x.x 终端 Ben$ brew install gcc --without-multilib Error: gcc-5.3.0 already inst ..
发布时间:2022-09-04 16:09:40 C/C++开发

FEATURE_NAMES必须唯一-XgBoost

我正在为一个非常稀疏的矩阵运行xgBoost模型。 我收到此错误。ValueError:FEATURE_NAMES必须唯一 我如何处理此问题? 这是我的代码。 yprob = bst.predict(xgb.DMatrix(test_df))[:,1] 推荐答案 根据xgboost source code documentation,该错误只出现在one pl ..
发布时间:2022-09-04 15:51:25 Python

在R中的XG-Boost中使用Forecate()时出错

我一直在运行不同的算法,根据其他几个参数来预测Facebook帖子的性能。我正在尝试的最后一种方法是XG-Boost。 即使在重新检查我的代码和包的文档之后,我仍然不断地收到错误。我的列车和测试数据都已清除,所有因子都已转换为带有1和0的列。 //处理测试和训练数据 temp.treat ..
发布时间:2022-08-27 19:38:05 其他开发

使用CPU工作器进行数据争论,并使用带DASK的GPU工作器培训xgBoost

我正在尝试从HDFS读取200个镶木地板文件,然后尝试使用4个GPU训练一个模型。我的机器上也有48个vcore可用。如果我只使用GPU工作器启动集群,那么读取部分将非常慢(因为它只使用分配给GPU工作器的4个CPU工作器,除非您在单独的外壳上运行它们,否则您不可能真正运行比您拥有的GPU数量更多的工作器,然后情况变得很糟糕,因为内存管理问题是您自己的。)我想使用CPU工作器读取文件,与CPU工作 ..
发布时间:2022-08-13 10:39:59 其他开发

如何知道在XGBoost中创建的树的数量

我有一个关于XGBoost的问题。 您知道如何知道在XGBoost中创建的树的数量吗? 与RandomForest不同,模型制造商决定制作多少棵树,XGBoost基本上继续创建树,直到损失函数达到一定的数字。因此我想知道这一点。 谢谢。 推荐答案 它有点歪曲,但我现在做的是dump-模型(XGBoost生成一个列表,其中每个元素都是单个树的字符串表示),然后计算列表中有多少 ..
发布时间:2022-04-22 19:04:25 Python

如何保存&加载 xgboost 模型?

来自 XGBoost 指南: 训练完成后,模型就可以保存了. bst.save_model('0001.model') 模型及其特征图也可以转储到文本文件中. #转储模型bst.dump_model('dump.raw.txt')# 带有特征图的转储模型bst.dump_model('dump.raw.txt', 'featmap.txt') 可以按如下方式加载保存的模型: bst ..
发布时间:2022-01-24 18:14:17 AI人工智能

如何在 R 包 XGBoost 中为 xgb.cv 指定训练和测试索引

我最近发现了 xgb.cv 中的 folds 参数,它允许指定验证集的索引.然后在 xgb.cv 中调用辅助函数 xgb.cv.mknfold,然后将每个折叠的剩余索引作为相应训练集的索引折叠. 问题:我可以通过 xgboost 接口中的任何接口同时指定训练和验证索引吗? 我的主要动机是执行时间序列交叉验证,我不希望将“非验证"索引自动分配为训练数据.一个例子来说明我想要做什么: # ..
发布时间:2022-01-11 09:45:16 其他开发

jupyter notebook 中的 XGBoost 内核崩溃

我不知道如何使 XGBoost 分类器工作.我在 Jupyter notebook 上运行下面的代码,它总是生成这条消息“内核似乎已经死了.它将自动重启." 从 xgboost 导入 XGBClassifier模型 = XGBClassifier()模型.fit(X, y) 导入 XGBClassifier 没有问题,但是在将其拟合到我的数据时会崩溃.X 是 502 由 33 个全数字数据帧, ..
发布时间:2022-01-10 21:40:57 Python

anaconda 的 xgboost 安装问题

我正在使用 Anaconda.我首先切换到 Python2(版本 2.7.11). python -VPython 2.7.11 :: Continuum Analytics, Inc. 我使用以下命令在 anaconda 中安装 xgboost. conda install -c https://conda.anaconda.org/akode xgboost 然后我检查了 xgboos ..
发布时间:2022-01-10 21:31:50 Python

如何在 Anaconda Python(Windows 平台)中安装 xgboost?

我是 Python 新用户.我从以下链接下载了最新的 Anaconda 3 2.4.1 (Python 3.5):https://www.continuum.io/downloads 我的电脑配置是:Windows 10、64 位、4GB RAM 在 Anaconda 命令提示符中的“pip install xgboost"失败后,我花了几个小时试图找到下载软件包的正确方法,但找不到任 ..
发布时间:2022-01-10 20:51:09 Python

在 PyCharm 中以退出代码 137 结束进程

当我在 PyCharm 中手动停止脚本时,进程以退出代码 137 结束.但我没有停止脚本.退出码 137 还是有,有什么问题? Python 版本为 3.6,运行 xgboost.train() 方法时处理完成. 解决方案 退出代码 137 表示您的进程被(信号 9)SIGKILL 杀死.如果您手动停止它 - 这就是您的答案. 如果您没有手动停止脚本并且仍然收到此错误代码,则该 ..
发布时间:2022-01-08 09:17:07 Python