decision-tree相关内容

scikit-learn在树结构中的每个叶子节点的决策标签都存放在哪里?

我已经使用scikit-learn训练了随机森林模型,现在我想将其树结构保存在文本文件中,以便可以在其他地方使用它。 根据此链接,一个树对象由一个并行数组的数量,每个数组包含有关树的不同节点的一些信息(例如,左子节点,右子节点,其检查的功能...)。但是,似乎没有有关与每个叶节点相对应的类标签的信息! 有人知道scikit-learn决策树结构中存储的类标签在哪里吗? 解决方案 看 ..
发布时间:2020-10-19 19:20:32 Python

使用sklearn,如何找到决策树的深度?

我正在用sklearn训练决策树。当我使用时: dt_clf = tree.DecisionTreeClassifier() max_depth 参数默认为 None 。根据文档,如果 max_depth 为 None ,则节点将被扩展直到所有叶子都是纯净的或直到所有叶子都包含小于 min_samples_split 个样本。 拟合模型后,如何找出 max_d ..
发布时间:2020-10-19 19:20:28 Python

使用所有变量的R决策树

我想执行决策树分析。我希望决策树使用模型中的所有变量。 我还需要绘制决策树。 这是我的数据集示例 >头(d) TargetGroup2000 TargetGroup2012吸烟Group_Kai PA_Score wheeze3哮喘3 tres3 1 2 2 4 2 0 0 0 2 2 2 4 3 1 0 0 3 2 2 5 1 0 0 0 4 2 2 4 2 ..
发布时间:2020-10-19 19:20:23 其他开发

检查列表的所有元素(Drools Expert)

我正在尝试在Drools Expert中编写规则。在规则的时间部分中,我检查了 Application 对象的某些属性。该对象包含一个列表,我想检查一堆规则是否适用于此列表中SomeOtherType的所有对象。该规则仅在该约束对于该列表中的所有对象均有效时才触发。 规则“符合应用程序” 当 app时:Application( 一些约束 &在app.getList()中为所有对象编写一些 ..
发布时间:2020-10-19 19:20:20 Java开发

Catboost plot_tree的理解

从catboost绘制树时,它在叶子中显示 val ;这些值代表什么? 我在他们有关绘图的官方教程中找不到答案,也找不到我能找到的任何此类问题。像这样: LightGBM plot_tree ()叶子编号 https://github.com/catboost/catboost/issues?q=plot_tree 解决方案 这些是由树。 多重分类和多元回归有多个价值。 ..
发布时间:2020-10-19 19:19:11 Python

Python-Graphviz-删除DecisionTreeClassifier节点上的图例

我有一个来自sklearn的决策树分类器,我使用pydotplus进行显示。 但是我真的不喜欢当演示中每个节点上都有很多信息时(熵,样本和值)。 要向人们解释,我会更容易喜欢只保留决定和阶级。 在哪里可以修改代码来完成它? 谢谢。 解决方案 根据文档 ,则无法放弃在框内设置其他信息。您唯一可能会隐式忽略的是杂质参数。 但是,我已经做了另一个方式有点歪。首先,我保存 . ..
发布时间:2020-10-19 19:19:06 Python

如何可视化Spark(pyspark)中的决策树模型?

我正在尝试可视化pyspark中的决策树结构。但是所有工具都是用于数据的。我找不到可视化树结构的​​任何东西。还是有一种方法可以使用 toDebugString 中的规则进行可视化? 解决方案 我尝试执行以下操作以创建可视化效果: 将Spark决策树输出解析为 JSON 格式。 使用 JSON 文件作为的输入D3.js 可视化。 有关更多代码,您可以在GitHub 此处。 ..
发布时间:2020-10-19 19:18:04 Python

如何显示测试样本的决策树路径?

我正在使用scikit中的 DecisionTreeClassifier -学习对一些多类数据进行分类。我发现了许多描述如何显示决策树路径的帖子,例如此处,此处和此处。但是,所有这些都描述了如何显示受过训练的数据的树。这是有道理的,因为 export_graphviz 只需要一个拟合模型。 我的问题是如何在测试样本上形象化树 (最好是 export_graphviz )。即用 clf.fit ..
发布时间:2020-10-19 19:17:49 Python

使用sklearn python通过决策树提取数据点的规则路径

我正在使用决策树模型,我想提取每个数据点的决策路径,以便了解造成Y的原因而不是进行预测。 我该怎么做?找不到任何文档。 解决方案 以下是使用 iris数据集的示例。 从sklearn.datasets导入load_iris 从sklearn导入树 导入graphviz iris = load_iris() clf = tree.DecisionTreeClassifie ..
发布时间:2020-10-19 19:17:47 Python

零件节点分配

是否可以为拟合的 rpart 树提取节点分配?当我将模型应用于新数据时该怎么办? 我的想法是,我想将节点用作群集数据的一种方式。在其他软件包(例如SPSS)中,我可以保存预测的类,概率和节点号以供进一步分析。 鉴于R有多强大,我想有一个简单的解决方案。 解决方案 尝试使用partykit软件包: library(rpart) z.auto ..
发布时间:2020-10-19 19:17:44 其他开发

如何在R中为C5.0软件包设置成本矩阵?

我在网上搜索了很多内容,但是没有找到R中C5.0函数的'costs'参数的有用描述。在C5.0 R手册中,它只是说“成本矩阵矩阵应具有C列和行,其中C是类级别数”。它不会告诉我行还是列是模型的预测结果。 任何人都可以 解决方案 以下是C5.0(版本0.1.0-15)的帮助页面中的报价: 成本矩阵应为CxC,其中C为类别数。 对角元素将被忽略。列应对应于真实的 类,而行则是预 ..
发布时间:2020-10-19 19:17:41 其他开发

哪些库可以用Python建模复杂的问卷?

对于一个医疗网站,我正在尝试对调查表进行建模,以得出一系列可能的诊断结果。问卷相当复杂,有很多条件。我制作了流程图/决策树来反映此问卷。我正在使用Django创建网站。 当前,我正在考虑使用 Python Graph 将流程图转换为加权图。 。每个问题将是一个节点,每个答案将是一个边沿+标签。然后,我可以遍历完整的图,而遍历的终点将是合适的诊断。 python graph是建模此问卷的 ..
发布时间:2020-10-19 19:17:37 Python

多元决策树学习器

确实存在很多单变量决策树学习器实现(C4.5等),但是实际上有人知道多变量决策树学习器算法吗? 解决方案 Bennett and Blue的支持向量机决策树方法通过对树中的每个决策使用嵌入式SVM进行多变量拆分。 类似地,在通过离散支持向量机(2009),Orsenigo和Vercellis将多类离散支持向量机(DSVM)嵌入到决策树节点中。 ..

将GridSearchCV与AdaBoost和DecisionTreeClassifier一起使用

我正在尝试使用DecisionTreeClassifier(“ DTC”)作为base_estimator来调整AdaBoost分类器(“ ABT”)。我想同时调整两者和ABT参数,但不确定如何实现-管道不起作用,因为我没有将DTC的输出“管道”到ABT。这个想法是在GridSearchCV估计器中迭代ABT和DTC的超参数。 如何正确指定调整参数? 我尝试了以下操作,这在下面产生了错 ..
发布时间:2020-10-19 19:17:30 Python

使用新数据更新决策树

我是决策树的新手。我正计划构建一个大型决策树,我希望稍后使用其他数据进行更新。最好的方法是什么?可以在以后更新任何决策树吗? 解决方案 决策树最常接受所有可用数据的训练。也就是说,当您拥有新数据时,您将重新训练整个树。由于此过程非常快,因此通常不会出现问题。如果数据太大而无法容纳在内存中,您通常可以通过对训练集进行二次采样(行采样)来解决它,因为基于树的模型不需要太多的数据即可得出良好的结 ..
发布时间:2020-10-19 19:17:28 其他开发