decision-tree相关内容

scikit学习DecisionTreeClassifier.tree_.value有什么作用?

我正在研究DecisionTreeClassifier模型,我想了解模型选择的路径.所以我需要知道 是什么值 DecisionTreeClassifier.tree_.value 谢谢 解决方案 您是正确的,因为该文档实际上对此并不了解(但是,老实说,我也不确定它的用处). 让我们从文档中的示例复制虹膜数据: from sklearn.datasets import lo ..
发布时间:2020-05-04 09:19:21 AI人工智能

为什么决策树结构只是sklearn DecisionTreeClassifier的二叉树?

我们可以从sklearn文档的此处看到,或者从在我的实验中,DecisionTreeClassifier的所有树结构都是二叉树.条件是基尼或熵,每个DecisionTreeClassifier节点只能有0或1或2个子节点. 但是从决策树介绍中幻灯片(第3页),理论决策树的每个节点可以有两个以上的子节点. 所以我的问题是,为什么sklearn DecisionTreeClassifier ..
发布时间:2020-05-04 09:15:33 AI人工智能

sklearn DecisionTreeClassifier可以真正使用分类数据吗?

在使用DecisionTreeClassifier时,我使用graphviz对其进行可视化,令我惊讶的是,它似乎需要分类数据并将其用作连续数据. 我所有的特征都是分类的,例如,您可以看到下面的树(请注意,第一个特征X [0]具有6个可能的值0、1、2、3、4、5: 此处,该类使用的是一个树类二叉树,所以这是sklearn的局限性. 有人知道我无法使用分类树吗? (我知道这对完成任务不是 ..

在下面的xgboost模型树图中,"leaf"的值是什么意思?

我猜想这是有条件的概率,因为存在上述(树分支)条件.但是,我不清楚. 如果您想了解有关使用的数据的更多信息或如何获得此图,请访问:解决方案 属性leaf是预测值.换句话说,如果对树模型的评估在该终端节点(也称为叶节点)处结束,那么这就是返回的值. 使用伪代码(树模型的最左侧分支): if(f1 ..

使用scikit-learn时,如何查找树拆分的属性?

我一直在探索scikit-learn,制作具有熵和基尼分裂准则的决策树,并探索其中的差异. 我的问题是,如何才能“打开引擎盖"并准确找出树木在每个级别上划分的属性及其相关的信息值,以便我可以看到这两个标准在何处做出不同的选择? /p> 到目前为止,我已经探索了文档中概述的9种方法.他们似乎不允许访问此信息.但是肯定可以访问此信息吗?我正在构想一个列表或字典,其中包含用于节点和增益的条目. ..
发布时间:2020-05-04 09:05:40 AI人工智能

树中使用的变量

我如何知道在构造的树中实际使用了哪些变量? model = tree(status~., set.train) 如果我写的话,我可以看到变量: summary(model) tree(formula = status ~ ., data = set.train) Variables actually used in tree construction: [1] "spread1" ..
发布时间:2020-05-04 09:03:44 AI人工智能

如何在python中提取随机森林的决策规则

不过我有一个问题.我听说有人在R中可以使用额外的程序包提取在RF中实现的决策规则,我尝试在python中用google搜索同样的东西,但是没有运气,如果有帮助的话. 预先感谢! 解决方案 假定您使用sklearn RandomForestClassifier,则可以找到单个决策树,如.estimators_.每棵树将决策节点存储为tree_下的多个NumPy数组. 这是一些示例代码, ..

在scikit的决策树中对random_state感到困惑

对random_state参数感到困惑,不确定为什么决策树训练需要一些随机性.我的想法是:(1)与随机森林有关吗? (2)与分割训练测试数据集有关吗?如果是这样,为什么不直接使用训练测试拆分方法( http://scikit-learn.org/stable/modules/generation/sklearn.cross_validation.train_test_split.html )? ..

决策表的本机Java解决方案

我正在与一位受人尊敬的同事讨论一个有趣的讨论,并想要一些额外的输入... 我需要在我的应用程序中实现一些基本的决策表逻辑。我当时希望使用OpenL Tablets来代表Excel电子表格中的决策数据。我喜欢它,它易于设置和维护,并且具有较小的内存和处理空间。我可以轻松添加新表,我有一些表超过100行,最多10个条件。这些数据非常静态,很少发生变化。 我的同事不希望将第三方api引入混合 ..
发布时间:2019-01-02 14:35:25 Java开发

数据驱动规则引擎 - 流口水

我一直在评估Drools作为规则引擎用于我们的商业Web应用程序。 我的用例是订单管理应用程序。 规则属于以下类型: - 如果用户类型为“特殊”,则额外提供5%折扣。 - 如果用户已制作10+已经购买,额外享受3%折扣。 - 如果产品类别为“旧”,请向价值5美元的用户赠送礼品篮。 - 如果产品类别为“NEW”,给价值1美元的用户赠送礼品篮 - 如果用户过去购物 ..
发布时间:2019-01-02 13:44:22 Java开发