decision-tree相关内容

决策树在Python中的应用

如何在Python中实现DecisionTree的思想。 在TicTacToe游戏中。每个GameState字符串代表当前情况 0为空,1为玩家1移动,2为玩家2移动 因此,3x3板的单个ameState看起来像'000200000' 游戏从头到尾的MovesTree看起来像 ['000200000', '000210000', '002210000', '002211000', ..
发布时间:2022-09-21 11:40:44 Python

R:从决策树中提取规则

我正在使用R编程语言。最近,我读到了一种新的决策树算法,称为强化学习树(RLT),它被认为有可能将&Quot;Better&Quot;决策树匹配到数据集。此处提供了该库的文档:https://cran.r-project.org/web/packages/RLT/RLT.pdf 我尝试使用此库对(著名的)虹膜数据集运行分类决策树: library(RLT) data(iris) fit ..
发布时间:2022-05-07 15:16:15 其他开发

导出/打印随机森林决策树/';随机森林分类器对象没有属性';树_';

大家晚上好 本文的目标是能够从随机决策树过程中绘制决策树。在运行不同的选项后,我总是得到下一个错误:‘RandomForestVinator’对象没有属性‘tree_’ 非常感谢任何帮助/代码示例/想法或链接,以便能够解决此问题。 在下一组代码中,我是如何绘制常规/常规决策树的。 clf_SMOTE1 = DecisionTreeClassifier(criterion=' ..
发布时间:2022-04-22 21:30:59 Python

为什么运行时要构造决策树mnlog(N)?

当m是特征量,n是样本量时,python acadkit-Learning站点(http://scikit-learn.org/stable/modules/tree.html)声明构建二叉决策树的运行时是mnlog(N)。 我知道log(N)来自分裂后树的平均高度。我理解,在每次拆分时,您必须查看每个功能(M),然后选择最好的一个进行拆分。我知道这是通过为该节点(N)的每个样本计算一个“最 ..

matlab 'fitctree' 的 CART 算法考虑了属性顺序,为什么?

这是一个例子,提到matlab的fitctree考虑了特征顺序!为什么? load ionosphere % 包含 X 和 Y 变量Mdl = fitctree(X,Y)视图(MDL,'模式','图表');X1=翻转(X);Mdl1 = fitctree(X1,Y)视图(Mdl1,'模式','图形'); 不同的模型,因此即使处理相同的特征,分类精度也不相同? 解决方案 在您的示例中,X ..
发布时间:2022-01-05 18:58:12 其他开发

使用 scikit-learn 时,如何找到我的树分裂的属性?

我一直在探索 scikit-learn,使用熵和基尼分裂标准制作决策树,并探索差异. 我的问题是,我怎样才能“打开引擎盖"并确切地找出树在每个级别上分裂的属性以及它们的相关信息值,以便我可以看到两个标准在哪里做出不同的选择? 到目前为止,我已经探索了文档中概述的 9 种方法.他们似乎不允许访问此信息.但确定这些信息是可访问的吗?我正在设想一个包含节点和增益条目的列表或字典. 感谢 ..
发布时间:2021-12-25 14:50:46 AI人工智能

scikit-learn DecisionTreeClassifier.tree_.value 有什么作用?

我正在研究一个 DecisionTreeClassifier 模型,我想了解该模型选择的路径.所以我需要知道什么值赋予了 DecisionTreeClassifier.tree_.value 解决方案 嗯,你说得对,文档实际上对此并不了解(但说实话,我也不确定它的用处). > 让我们用虹膜数据复制文档中的示例: from sklearn.datasets import load_iri ..
发布时间:2021-12-25 14:48:31 AI人工智能

如何从 scikit-learn 解释决策树

我在理解 scikit-learn 决策树的结果时有两个问题.例如,这是我的决策树之一: 我的问题是我如何使用这棵树? 第一个问题是:如果一个样本满足条件,那么它去LEFT分支(如果存在),否则它去RIGHT.就我而言,如果 X[7] > 63521.3984 的样本.然后样品将进入绿色框.正确吗? 第二个问题是:当一个样本到达叶子节点时,我如何知道它属于哪个类别?在这个例子中, ..
发布时间:2021-12-25 14:35:50 Python

`sample_weight` 对 `DecisionTreeClassifier` 在 sklearn 中的工作方式有何影响?

我已阅读相关文档 : 类平衡可以通过从每个类中采样相等数量的样本来完成,或者最好通过将每个类的样本权重总和 (sample_weight) 归一化为相同的值. 但是,我仍然不清楚这是如何工作的.如果我将 sample_weight 设置为只有两个可能值的数组,1 和 2,这是否意味着带有 2 的采样频率将是 1 的样本的两倍?我想不出一个实际的例子. 解决方案 一些快速准备: ..
发布时间:2021-12-25 14:20:10 其他开发

将分类数据传递给 Sklearn 决策树

有几篇关于如何将分类数据编码为 Sklearn 决策树的帖子,但从 Sklearn 文档中,我们得到了这些 决策树的一些优点是: (...) 能够处理数字和分类数据.其他技术通常专门用于分析只有一种类型变量的数据集.有关详细信息,请参阅算法. 但是运行下面的脚本 将熊猫导入为 pd从 sklearn.tree 导入 DecisionTreeClassifier数据 = p ..
发布时间:2021-12-25 14:19:44 Python

下面xgboost模型树图中'leaf'的值是什么意思?

鉴于上述(树枝)条件存在,我猜测这是条件概率.不过我不是很清楚. 如果您想了解有关所用数据的更多信息或我们如何获得此图表,请访问:http://machinelearningmastery.com/visualize-gradient-boosting-decision-trees-xgboost-python/ 解决方案 属性 leaf 是预测值.换句话说,如果树模型的评估在那个终 ..

帮助理解交叉验证和决策树

我一直在阅读决策树和交叉验证,我理解这两个概念.但是,我无法理解交叉验证,因为它与决策树有关.本质上,当数据集相对较小时,交叉验证允许您在训练和测试之间交替以最大化您的错误估计.一个非常简单的算法是这样的: 决定你想要的折叠次数 (k) 将您的数据集细分为 k 折 对训练集使用 k-1 折叠来构建一棵树. 使用测试集来估计有关树中错误的统计信息. 保存您的结果以备后用 重复步骤 3 ..
发布时间:2021-12-14 10:08:51 AI人工智能

如何解决 Python sklearn 随机森林中的过度拟合?

我正在使用在 python sklearn 包中实现的 RandomForestClassifier 来构建二进制分类模型.以下是交叉验证的结果: 折叠 1 : 训练: 164 测试: 40训练精度:0.914634146341测试准确度:0.55折叠 2:训练:163 测试:41训练精度:0.871165644172测试精度:0.707317073171折叠 3:训练:163 测试:41训练精 ..

python中如何提取随机森林的决策规则

不过我有一个问题.我从某人那里听说,在 R 中,您可以使用额外的包来提取在 RF 中实现的决策规则,我尝试在 python 中搜索相同的东西,但没有运气,如果对如何实现有任何帮助.提前致谢! 解决方案 假设您使用 sklearn RandomForestClassifier,您可以找到作为 .estimators_ 的单个决策树.每棵树将决策节点存储为 tree_ 下的多个 NumPy 数 ..