decision-tree相关内容

sklearn DecisionTreeClassifier 真的可以处理分类数据吗?

在使用 DecisionTreeClassifier 时,我 使用 graphviz 对其进行了可视化,不得不说,令我惊讶的是,它似乎需要分类数据并将其用作连续数据. 我所有的特征都是分类的,例如你可以看到下面的树(请注意第一个特征,X[0],有 6 个可能的值 0、1、2、3、4、5:从我发现 here 该类使用了一个树类二叉树,所以是sklearn的一个限制. 有谁知道我缺少一种明 ..

解释 Graphviz 输出以进行决策树回归

我很好奇 Graphviz 在用于回归时生成的决策树节点中的 value 字段是什么.我知道这是在使用决策树分类时每个类中被分割分开的样本数,但我不确定这对回归意味着什么. 我的数据有一个 2 维输入和一个 10 维输出.这是我的回归问题的树的示例: 使用此代码制作 &使用 webgraphviz 可视化 # X = (n x 2) Y = (n x 10) X_test = (m ..

对 scikit learn 决策树中的 random_state 感到困惑

对 random_state 参数感到困惑,不知道为什么决策树训练需要一些随机性.我的想法,(1)它与随机森林有关吗?(2) 是否与拆分训练测试数据集有关?如果是这样,为什么不直接使用训练测试拆分方法(http://scikit-learn.org/stable/modules/generated/sklearn.cross_validation.train_test_split.html)? ..

如何从 scikit-learn 决策树中提取决策规则?

我可以从决策树中训练有素的树中提取底层决策规则(或“决策路径")作为文本列表吗? 类似于: if A>0.4 then if B0.8 then class='X' 解决方案 我相信这个答案比这里的其他答案更正确: from sklearn.tree import _treedef tree_to_code(tree, feature_names):树_ = 树.树_特征名称 = [ ..

如何在 spark ml 中处理决策树、随机森林的分类特征?

我正在尝试在 UCI 银行营销数据上构建决策树和随机森林分类器 -> https://archive.ics.uci.edu/ml/datasets/bank+marketing.数据集中有许多分类特征(具有字符串值). 在 spark ml 文档中,提到可以通过使用 StringIndexer 或 VectorIndexer 进行索引将分类变量转换为数字.我选择使用 StringIndex ..
发布时间:2021-11-14 21:04:39 其他开发

决策树生成具有相同类的终端叶

我对决策树比较陌生,并且坚持使用我的决策树算法.我正在使用交叉验证和参数调整来优化以下示例的分类:https://medium.com/@haydar_ai/learning-data-science-day-22-cross-validation-and-parameter-tuning-b14bcbc6b012.但是无论我如何调整我的参数,我总是得到这样的结果(这里只是一个小树的例子): ..
发布时间:2021-07-16 20:07:42 Python

在Weka中对单个实例进行分类

我使用WEKA gui训练并创建了J48模型.我将模型文件保存到计算机上,现在我想用它来对Java代码中的单个实例进行分类.我想对属性"cluster"进行预测.我要做的是以下事情: 公共无效分类(double lat,double lon,double co){//创建要与分类器一起使用的属性属性latitude = new Attribute("latitude");属性经度=新属性(“经度 ..

在决策树中称量样品

我构建了一个决策树,该决策树将每个样本均等地加权.现在构造一个决策树,为不同的样本赋予不同的权重.我唯一需要做的更改是在计算信息增益之前找到期望的熵.我有点困惑如何进行,请解释.... 例如:考虑一个包含p个正节点和n个负节点的节点,因此节点的熵为 -p/(p + n)log(p/(p + n))-n/(p+ n)log(n/(p + n)).现在,如果发现分裂,以某种方式将父节点划分为两个 ..

如何手动选择决策树的功能

我需要能够更改用于构建决策树的功能(具有机器学习的含义).以Iris数据集为例,我希望能够选择Sepallength作为根节点中使用的功能,并选择Petallength作为第一级节点中使用的功能,依此类推. 我想明确一点,我的目的不是更改最小样本分割和决策树的随机状态.而是选择特征-被分类元素的特征-并将它们放在决策树的某些节点中. 然后,代码应该能够找到最佳阈值-每个节点的范围-产生 ..

遍历sklearn决策树

如何处理sklearn决策树的广度优先搜索遍历? 在我的代码中,我尝试了sklearn.tree_库,并使用了诸如tree_.feature和tree_.threshold之类的各种功能来理解树的结构.但是,如果我想做bfs,这些功能会遍历树的dfs吗? 假设 clf1 = DecisionTreeClassifier(max_depth = 2)clf1 = clf1.fit(x ..
发布时间:2021-04-29 20:38:48 Python

如何建立决策树回归模型

我正在学习ML,并且正在做一个简单的动手,如下所示: //将boston.data分成两个名称为x_train和x_test的集合.另外,将boston.target分成两组y_train和y_test. 使用默认参数从x_train集合构建决策树回归模型.// 我为此做了以下代码: sklearn导入数据集中的 ,model_selection,树波士顿= datasets ..
发布时间:2021-04-29 20:38:46 AI人工智能