decision-tree相关内容
我正在尝试确保在树对象和预测测试集中都完整地表示了我所有类型因子的特征(就所有可能的因子水平而言). for (j in 1:length(predictors)){ if (is.factor(Test[,j])){ ct [[names(predictors)[j]]]
..
我已经通过party包使用ctree函数构建了决策树.它有1700个节点. 首先,在ctree中是否可以给出maxdepth自变量?我尝试了control_ctree选项,但是它抛出了一些错误消息,提示找不到ctree函数. 此外,如何使用此树的输出?如何在SAS或SQL等其他平台上实现它.我还对节点末尾的"* weights = 4349 "值表示什么有另一个疑问.我将如何知道哪个终端节点
..
我有一个使用ctree()分析的分类树,想知道如何旋转终端节点以使轴垂直? library(party) data(iris) attach(iris) plot(ctree(Species ~ Sepal.Length + Sepel.Width + Petal.Length + Petal.Width, data = iris)) 解决方案 以下是我的处理方法.不是最短
..
如您在图片中所见,我有以下图表,有什么方法可以查看叶节点中确切的百分比数量吗? 解决方案 如果要“看到" 百分比,最简单的方法是将终端节点与响应,然后查看条件比例. 如果您想“看到" 在条形图中的比例,那么到目前为止,尚不可能这样做.但是,我调整了node_barplot()函数以适应此功能.因此,如果您从R-Forge重新安装partykit软件包(party软件包的后继产品),则
..
我有一个数据集,该数据集包含6个类别变量,级别从5到28.我从 ctree()(方包)获得了具有17个终端节点的输出.我从但是,我在运行代码时收到以下错误消息: Error in data.frame(ResulTable, Means, Counts) : arguments imply differing number of rows: 17, 2 我尝试添加以下额外的行:
..
我已经检查了binary tree类方法和如何从ctree函数中提取树结构?(这有助于理解S4对象的结构和插槽),但仍不清楚如何获得ctree对象的最终预测变量.对于rpart,我会使用类似的 extract_preds
..
我有一个ctree()(party包)的输出,如下所示.如何获取每个终端节点的拆分条件列表,例如sns 1等? 1) sns
..
我已经开始为有关生物的游戏编写PHP脚本,这里有4个是/否问题,而我试图做的是编写一个函数,该函数将显示2个按钮,分别说是和否,然后分别给出不同的名称.当我运行该函数时,例如yes1和no1,那么下次运行该函数时,按钮的名称将为yes2和no2. 我已经尝试过执行此操作,但是它无法正常工作,下面是我到目前为止已完成的代码,我们将不胜感激.
..
在我现在正在处理的应用程序中,我需要定期检查成千上万个对象是否适合某种服务.决策图本身采用以下形式,只是形式更大:在每个末端节点(圆圈)中,我需要运行一个动作(更改对象的字段,日志信息等).我尝试使用Drool Expert框架,但是在那种情况下,我需要为图中通往终端节点的每个路径编写一条长规则. Drools Flow似乎也不是为这种用例而构建的-我拿了一个对象,然后根据一路上的决定,最终到达了
..
我正在尝试解释h2o GBM模型所做出的决定.根据想法: https://medium. com/applied-data-science/new-r-package-the-xgboost-explainer-51dd7d1aa211 我想计算每个功能对测试时做出决定的贡献. 是否可以从ensable中获取每个单独的树以及每个节点上的对数奇数? 在进行预测时,还需要按模型遍历每棵树的路径.
..
这是我上一个的后续问题:用于逻辑表达式解析和评估的更好的类结构 简介: 规则作为字符串 逻辑和,逻辑或,逻辑求反和分组,通过标识符(ID)的括号括起来 例如:“ {100} AND(({{101}或{102})OR({103}和{104}))非({105} OR {106})“ 当前已被评估为节点的二叉树,如下所示: 从此处获取的代码:如何解析布尔表达式并将其加载到
..
让 std :: vector counts 是正整数的向量,并让 N:= counts [0] + ... + counts [counts.length()-1] 是向量分量的总和。设置 pi:= counts [i] / N ,我使用经典公式 H = p0 * log2(p0)+ ...计算熵。 + pn * log2(pn)。 个计数向量正在变化- -计数增加---并且每
..
我正在中实现 C4.5算法 .net ,但是我不清楚它如何处理“连续(数字)数据”。有人可以给我更详细的解释吗? 解决方案 对于连续数据C4.5使用阈值,其中所有小于阈值的值在左侧节点中,所有大于阈值的内容都在右侧节点中。问题是如何根据给定的数据创建该阈值。诀窍是按照连续变量的升序对数据进行排序。然后遍历数据,在数据成员之间选择一个阈值。例如,如果您的属性x数据为: 0.5,1.2
..
我正在使用Apache Spark Mllib 1.4.1(PySpark,Spark的python实现)基于我拥有的LabeledPoint数据生成决策树.该树会正确生成,我可以将其打印到终端(此用户称其为model = DecisionTree.trainClassifier( ... ) print(model.toDebugString() 但是我要做的是可视化或绘制决策树,而不是将
..
问题 我试图基于仅具有名义属性的数据集从头开始在Python中构建一个二进制决策树分类器. 我坚持的第一步是找到所有可能的方法来计算名义属性的二进制拆分.例如,对于具有可能值[a,b,c,d]的属性,我正在寻找一种将这些值分成两个数组的方式,以便获得: left right ---- ----- a bcd b acd
..
此问题与此帖子中给出的答案有关. 我想将Weka中树分析的输出转换为决策拆分和叶值的分层表(如上面的链接所示).我可以解析Weka输出以提取fac,split和val值,但是我正在努力解析输出并生成正确的hierachyid值. 我要注意的第一件事是树描述与decisions中的记录不是一一对应的. Weka输出中有20行,而decisions表中有21条记录.这是因为有11个叶节点和
..
我使用了此链接中的CHAID包.给了我一个可以绘制的chaid对象.我想要一个决策表,其中每个决策规则都放在一列中,而不是决策树中. .但是我不明白如何访问这个chaid对象中的节点和路径.请帮助我. 我按照此链接 由于数据太长,我无法在此处发布数据.因此,我正在发布一个代码,该代码将使用chaid提供的示例数据集来执行任务. 从chaid的帮助手册中复制: library("C
..
我正在使用带有推理引擎(正向链接)的专家系统,我想解释一下为什么它比使用非常简单的概念的决策树更好. (在一种特定情况下) 我知道在stackoverflow上有一个类似的问题,但这不是我正在寻找答案. 这是我的问题: 对于客户关系管理,我正在使用许多不同的业务规则(这些规则会引发对话规则)来帮助客户对一种产品做出决定. 注意:规则会频繁添加(每天2条). 客户在获得答
..
我一直在尝试将测试随机分为测试集和训练集,并在5层深的决策树上进行训练,并绘制决策树. P.s.我不允许使用熊猫. 这是我尝试做的事情: import numpy from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score from sklearn impor
..
从scikit-learn了解决策树的结果时,我遇到两个问题.例如,这是我的决策树之一: 第一个问题是:如果样本满足条件,则转到 LEFT 分支(如果存在),否则转到 RIGHT .就我而言,如果样本的X [7]> 63521.3984.然后样品将进入绿色框.正确吗? 第二个问题是:当样本到达叶节点时,我怎么知道它属于哪个类别?在此示例中,我要分类三个类别.在红色框中,分别有91个,2
..