weka相关内容

SMOTE过采样和交叉验证

我正在处理Weka中的二进制分类问题,该问题具有高度不平衡的数据集(一种类别为90%,另一种类别为10%).我首先应用了SMOTE( http: //www.cs.cmu.edu/afs/cs/project/jair/pub/volume16/chawla02a-html/node6.html )到整个数据集以使类别均匀,然后进行10倍对新获得的数据进行交叉验证.我发现(过度?)F1的乐观结果约 ..
发布时间:2020-05-04 09:48:07 AI人工智能

无法使用Java中的Weka访问用于ML分类的训练数据集

我正在尝试使用Java(特别是Android Studio)中的Weka对实例进行分类.最初,我从Desktop Weka GUI中保存了一个模型,然后尝试将其导入到我的项目目录中.如果我是正确的话,这将无法正常工作,因为Weka JDK在PC和Android上是不同的. 现在,我正在尝试通过导入训练数据集在Android本身上训练模型(如我所见,没有其他选择).这是我遇到问题的地方.当我运 ..
发布时间:2020-05-04 09:45:23 Java开发

如何在Weka的资源管理器中应用分类器?

比方说,我已经建立了一个模型(例如J4.8树)并通过交叉验证对其进行了评估.如何使用此模型对新数据集进行分类?我知道,我可以使用“设置的测试集"选项设置一个带有数据分类的文件,在“更多选项"窗口中标记“输出预测",然后再次运行分类.它几乎可以满足我的需求,但这似乎是一个非常奇怪的工作流程.此外,它会重新创建所有模型,这可能会花费不必要的时间.有没有更直接的方法可以对已经建立的模型进行分类? ..
发布时间:2020-05-04 09:41:42 AI人工智能

训练和测试集在weka中不兼容吗?

我正在尝试用新的数据集测试我的模型.我已经完成了与建立模型相同的预处理步骤.我已经比较了两个文件,但是没有问题.我具有相同顺序,相同属性名称和数据类型的所有属性(训练与测试数据集).但我仍然无法解决问题.训练和测试这两个文件似乎相似,但是Weka Explorer给我错误,说训练和测试集不兼容.如何解决这个错误?有什么办法可以将test.arff文件格式设置为train.arff?请有人帮我. ..
发布时间:2020-05-04 09:40:08 AI人工智能

如何在Android Studio中使用经过预训练的.model文件进​​行预测?

我已经在Weka 3.8 Dekstop版本中训练了决策表ML模型.我已将模型相应地保存在我的资产文件夹中,并配置了wekaSTRIPPED.jar文件.此时,该构建似乎可以在Android Studio上正常运行.但是,当我尝试在Java中使用分类模型时,在无法自动修复的代码上出现一些红色突出显示-错误-. 我已经访问了一些在线指南此处,并访问了此常用的weka- android参考此处和 ..
发布时间:2020-05-04 09:38:25 Java开发

在weka中测试没有实例标签的单个实例

这个问题已经被问到了,但是我不明白答案,所以我再次发布这个问题,请回答. 我有一个weka模型,例如:j48我已经为我的数据集训练了该模型,现在我不得不用一个应该返回类标签的实例来测试该模型.怎么做? 我尝试了以下方法: 1)当我将测试实例的a,b,c,class设为?时.正在显示评估分类器的问题.训练和测试不兼容 2)当我列出所有班级标签并放入?时像这样的测试实例的类标签 ..
发布时间:2020-05-04 09:37:39 AI人工智能

如何使用MATLAB从WEKA检索类值

我正在尝试使用MATLAB和WEKA API从WEKA检索类.一切看起来不错,但类始终为0.任何想法?? 我的数据集有241个属性,将WEKA应用于该数据集,我获得了正确的结果. 创建第一个训练和测试对象,而不是构建分类器并执行classifyInstance.但这会给出错误的结果 train = [xtrain ytrain]; test = [xtest]; ..

如何处理C4.5(J48)决策树中缺少的属性值?

用Weka的C4.5(J48)决策树处理缺失要素属性值的最佳方法是什么?在训练和分类过程中都会出现缺少值的问题. 如果训练实例中缺少值,那么我假设放置了“?"是否正确?功能的价值? 假设我能够成功构建决策树,然后从Weka的树结构中以C ++或Java创建自己的树代码.在分类期间,如果我想对新实例进行分类,对于缺少值的要素,我应该赋予什么值?我如何将树下降经过一个值未知的决策节点? ..

Weka 3.7中RandomForest的确切实现

在回顾了最初的Breiman(2001)论文以及其他一些董事会职位之后,我对WEKA的随机森林实现所使用的实际过程感到有些困惑.没有足够详尽的消息来源,甚至有很多相互矛盾的地方. 它如何详细工作,执行哪些步骤? 到目前为止我的理解: 为每棵树创建一个与训练数据大小相同的引导程序样本 每个节点仅考虑定义大小的可用特征的随机子集(可以在WEKA中选择参数) 关于所使用的基础树学习 ..

.arff文件与scikit-learn?

我想使用属性关系文件格式使用scikit-learn执行一些NLP任务,这可能吗? 如何将.arff文件与scikit-learn一起使用? 解决方案 我真的推荐 liac-arff .它不会直接加载到numpy,但是转换很简单: import arff, numpy as np dataset = arff.load(open('mydataset.arff', 'rb')) da ..
发布时间:2020-05-04 09:32:12 AI人工智能

WEKA分类的可能性

我想知道WEKA中是否有一种方法可以输出许多“最佳猜测"进行分类. 我的场景是:例如,我使用交叉验证对数据进行分类,然后在weka的输出上得到如下信息:这是对该实例进行分类的3个最佳方法.我想要的是,即使实例未正确分类,我也会得到该实例的3个或5个最佳猜测的输出. 示例: 类别:A,B,C,D,E 实例:1 ... 10 输出将是: 实例1有90%的人可能是A类,有75%的 ..
发布时间:2020-05-04 09:14:53 AI人工智能

在命令行上学习Weka

我对Weka相当陌生,在命令行上对Weka甚至还比较陌生.我发现文档很差,我正在努力找出一些要做的事情.例如,要获取两个.arff文件,一个用于培训,一个用于测试,并获取测试数据中缺少标签的预测输出. 我该怎么做? 我将此代码作为起点 java -classpath weka.jar weka.classifiers.meta.FilteredClassifier -t "tra ..
发布时间:2020-05-04 09:06:48 AI人工智能

Weka中的一元课程文字分类?

我有一个针对特定类别(例如癌症)的训练数据集(文本).我想在weka中为该课程训练一个SVM分类器.但是,当我尝试通过创建文件夹"cancer"并将所有这些训练文件放入该文件夹来执行此操作时,当我运行代码时,出现以下错误: weka.classifiers.functions.SMO:无法处理一元类! 我想做的是,如果分类器找到与“癌症"相关的文档,它会正确说出类名,一旦我输入了非癌症文档, ..
发布时间:2020-05-04 09:04:32 AI人工智能

weka中的测试文件是否需要与train相同或更少的功能?

我已经从两个不同的数据集中准备了两个不同的.arff文件,一个用于测试,另一个用于训练.它们每个都有相同的实例,但是不同的特征会更改每个文件的特征向量的维数.当我对这些文件中的每个文件进行交叉验证时,它们运行良好.这表明.arff文件已正确准备,没有任何错误. 现在,如果我使用与测试文件相比尺寸较小的训练文件进行评估.我收到以下错误. Exception in thread "main ..
发布时间:2020-05-04 09:04:28 AI人工智能

Weka:10倍CV中各折的结果

对于Weka Explorer(GUI),当我们对任何给定的 ARFF 文件进行10倍CV验证时,Weka Explorer提供的数据(据我所知)是所有文件的平均结果10折. 问.是否有任何方法可以得出每折的结果?例如,我需要每个折叠的错误率(标识错误的实例). 帮助表示赞赏. 解决方案 我认为使用Weka的GUI可以实现 .不过,您需要使用实验器而不是资源管理器.步骤如下: ..
发布时间:2020-05-04 08:57:32 AI人工智能

如何在Weka中使用不同的缩放方法

我正在将logistic regression与我在weka中的数据一起使用.现在,我想尝试不同的缩放方法来改善结果,例如最小值/最大值,零均值/单位,方差,长度等. weka中是否有使用缩放的选项? 解决方案 Weka包含用于数据预处理的方法: weka.filters.unsupervised.attribute.Normalize weka.filters.unsuper ..
发布时间:2020-05-04 03:19:44 Java开发

如何解释Weka Logistic回归输出?

请帮助解释Weka库中weka.classifiers.functions.Logistic产生的逻辑回归结果. 我使用来自Weka示例的数字数据: @relation weather @attribute outlook {sunny, overcast, rainy} @attribute temperature real @attribute humidity real @at ..
发布时间:2020-05-04 03:17:39 其他开发