decision-tree相关内容
我正在研究DecisionTreeClassifier模型,我想了解模型选择的路径.所以我需要知道 是什么值 DecisionTreeClassifier.tree_.value 谢谢 解决方案 您是正确的,因为该文档实际上对此并不了解(但是,老实说,我也不确定它的用处). 让我们从文档中的示例复制虹膜数据: from sklearn.datasets import lo
..
我想在到目前为止,对于基于import numpy as np import matplotlib.pyplot as plt from sklearn.tree import DecisionTreeClassifier from sklearn.datasets import make_moons # Generate some example data X, y = make_moons(n
..
我们可以从sklearn文档的此处看到,或者从在我的实验中,DecisionTreeClassifier的所有树结构都是二叉树.条件是基尼或熵,每个DecisionTreeClassifier节点只能有0或1或2个子节点. 但是从决策树介绍中幻灯片(第3页),理论决策树的每个节点可以有两个以上的子节点. 所以我的问题是,为什么sklearn DecisionTreeClassifier
..
在使用DecisionTreeClassifier时,我使用graphviz对其进行可视化,令我惊讶的是,它似乎需要分类数据并将其用作连续数据. 我所有的特征都是分类的,例如,您可以看到下面的树(请注意,第一个特征X [0]具有6个可能的值0、1、2、3、4、5: 此处,该类使用的是一个树类二叉树,所以这是sklearn的局限性. 有人知道我无法使用分类树吗? (我知道这对完成任务不是
..
我猜想这是有条件的概率,因为存在上述(树分支)条件.但是,我不清楚. 如果您想了解有关使用的数据的更多信息或如何获得此图,请访问:解决方案 属性leaf是预测值.换句话说,如果对树模型的评估在该终端节点(也称为叶节点)处结束,那么这就是返回的值. 使用伪代码(树模型的最左侧分支): if(f1
..
我正在使用在python sklearn包中实现的RandomForestClassifier构建二进制分类模型.以下是交叉验证的结果: Fold 1 : Train: 164 Test: 40 Train Accuracy: 0.914634146341 Test Accuracy: 0.55 Fold 2 : Train: 163 Test: 41 Train Accuracy:
..
我一直在探索scikit-learn,制作具有熵和基尼分裂准则的决策树,并探索其中的差异. 我的问题是,如何才能“打开引擎盖"并准确找出树木在每个级别上划分的属性及其相关的信息值,以便我可以看到这两个标准在何处做出不同的选择? /p> 到目前为止,我已经探索了文档中概述的9种方法.他们似乎不允许访问此信息.但是肯定可以访问此信息吗?我正在构想一个列表或字典,其中包含用于节点和增益的条目.
..
我如何知道在构造的树中实际使用了哪些变量? model = tree(status~., set.train) 如果我写的话,我可以看到变量: summary(model) tree(formula = status ~ ., data = set.train) Variables actually used in tree construction: [1] "spread1"
..
我有一个这样的字典对象: menu = {'dinner':{'chicken':'good','beef':'average','vegetarian':{'tofu':'good','salad':{'caeser':'bad','italian':'average'}},'pork':'bad'}} 我正在尝试使用pydot和'menu'数据创建图形(决策树)“晚餐"将是顶部节点,
..
我正在R中使用rpart进行分类.树模型是由以下人员训练的: > tree pData1 sum(testData$activity==pData1)/length(pData1) [1] 0
..
不过我有一个问题.我听说有人在R中可以使用额外的程序包提取在RF中实现的决策规则,我尝试在python中用google搜索同样的东西,但是没有运气,如果有帮助的话. 预先感谢! 解决方案 假定您使用sklearn RandomForestClassifier,则可以找到单个决策树,如.estimators_.每棵树将决策节点存储为tree_下的多个NumPy数组. 这是一些示例代码,
..
对random_state参数感到困惑,不确定为什么决策树训练需要一些随机性.我的想法是:(1)与随机森林有关吗? (2)与分割训练测试数据集有关吗?如果是这样,为什么不直接使用训练测试拆分方法( http://scikit-learn.org/stable/modules/generation/sklearn.cross_validation.train_test_split.html )?
..
我遇到以下错误 c50代码称为值1的退出 我正在根据Kaggle的泰坦尼克号数据进行此操作 # Importing datasets train
..
我通过scikit-learn库学习机器学习.我应用 决策树分类器和随机森林分类器通过以下代码对我的数据进行处理: def decision_tree(train_X, train_Y, test_X, test_Y): clf = tree.DecisionTreeClassifier() clf.fit(train_X, train_Y) return clf
..
我可以从决策树中经过训练的树中提取出基本的决策规则(或“决策路径")作为文本列表吗? 类似: if A>0.4 then if B0.8 then class='X' 感谢您的帮助. 解决方案 我相信这个答案比这里的其他答案更正确: from sklearn.tree import _tree def tree_to_code(tre
..
让我说我有这棵树: cough Yes / \ No sneezing sneezing Yes /
..
我正在尝试在Jupyter Notebook中显示决策树,并且不断收到以下消息: CalledProcessError: Command '['dot.bat', '-Tsvg']' returned non-zero exit status 1 我正在使用以下代码: from sklearn.datasets import load_iris from sklearn impo
..
我正在与一位受人尊敬的同事讨论一个有趣的讨论,并想要一些额外的输入... 我需要在我的应用程序中实现一些基本的决策表逻辑。我当时希望使用OpenL Tablets来代表Excel电子表格中的决策数据。我喜欢它,它易于设置和维护,并且具有较小的内存和处理空间。我可以轻松添加新表,我有一些表超过100行,最多10个条件。这些数据非常静态,很少发生变化。 我的同事不希望将第三方api引入混合
..
我一直在评估Drools作为规则引擎用于我们的商业Web应用程序。 我的用例是订单管理应用程序。 规则属于以下类型: - 如果用户类型为“特殊”,则额外提供5%折扣。 - 如果用户已制作10+已经购买,额外享受3%折扣。 - 如果产品类别为“旧”,请向价值5美元的用户赠送礼品篮。 - 如果产品类别为“NEW”,给价值1美元的用户赠送礼品篮 - 如果用户过去购物
..
使用分类器完成10倍交叉验证后,如何打印出每个实例的预测类以及这些实例的分布? J48 j48 = new J48(); 评估eval =新评估(newData); eval.crossValidateModel(j48,newData,10,new Random(1)); 当我尝试类似下面的内容时,它说分类器没有构建。 for(int i = 0; i
..