weka相关内容

在 Weka Java API 中创建字符串属性

我正在尝试使用 Weka 的 Java API 创建一个新的字符串属性... 通读API javadocs,看来这样做的方法是使用这个构造函数: 属性公共属性(java.lang.String 属性名,FastVector 属性值)名义属性和字符串属性的构造函数.如果将属性值的空向量传递给该方法,则假定该属性是字符串.参数:attributeName - 属性的名称attributeVal ..
发布时间:2021-11-15 00:40:18 Java开发

在 PHP 应用程序中调用 Weka 工具

我正在开发一个网络应用程序来分析一个人的睡眠习惯对他的健康和表现的影响..谁能帮我了解如何将 weka 工具集成到我的应用程序中..用于数据分析?? 解决方案 你可能想看看 shell_exec(或exec,系统、passthru) 有关这些功能差异的摘要,此答案可能对您有所帮助:https://stackoverflow.com/a/20072886/3052648 ..
发布时间:2021-09-24 20:11:12 PHP

Weka 分类器元投票

我在weka中使用多数投票组合规则.总共有4个分类器.我想知道如果票数出现平局会发生什么 解决方案 Weka API :“..... 用于打破多数投票关系的随机数生成器..".见:http://fiji.sc/javadoc/weka/classifiers/meta/Vote.html 如果您对代码感兴趣,这就是他们的做法: //根据均匀随机分布解析关系 int 多数索 ..
发布时间:2021-09-24 20:11:09 其他开发

Java/Weka - 需要创建独特的实例

我想知道是否有一种方法可以检查我的新实例是否已经在Java中创建并添加到我的实例中...喜欢; Instance instance = new Instance(i, vals);if(instances.contains(instance) == false) {//或者hasInstance可能实例.添加(实例);} 解决方案 我明白,你想要两个对象 x1 和 x2 和 x1.equal ..
发布时间:2021-09-24 20:11:06 Java开发

如何使用weka从文本参数中提取关键短语

我正在开展一个项目“从文本参数中提取关键短语".为此,我首先进行了输入清理,然后使用斯坦福解析器(POS 标记)确定了候选短语列表(总共大约 300 个).然后我计算了每个短语的特征值.我对数据集中的每个文档都遵循了这些步骤.现在我应该如何进行,即如何使用 WEKA 来查找关键短语.我应该如何在 weka 中存储短语和特征值(TFXIDF).如何找到最终项目的效率?? 解决方案 WEKA ..
发布时间:2021-09-24 20:11:03 其他开发

如何编辑weka配置以找到“1"

我有一个带有布尔结果的 arff 表. 大多数行以“0"结尾(例如 95%).但是“0"对我不感兴趣.我希望 weka 找到以“1"结尾的行. 但不幸的是,大多数算法始终只选择“0".这对我一点帮助都没有. 如何让weka只达到“1"?(如果可能的话)? 解决方案 我认为您在描述经典的类不平衡问题.也就是说,几乎所有机器学习算法都旨在寻找最佳准确性.在您的情况下,如果它每 ..
发布时间:2021-09-24 20:11:01 其他开发

如何在 Weka 中测试用户输入的单个测试用例?

我对 Weka 还很陌生.我正在编写一个代码,其中我构建了一个 J48 来预测学生成绩的结果.现在我已经尝试使用 ARFF 文件测试模型,但我想实现用户输入的测试用例的分类.例如.我希望用户输入两个数值,它们是在两个科目(即 CS 和数学)中获得的分数,然后预测他们的最终结果,即通过或失败.结果将是类变量. 我不知道如何创建一个实例来执行这样的事情 double pred = tree.C ..
发布时间:2021-09-24 20:10:57 Java开发

训练数据和测试数据具有不同数量的属性,导致错误“训练和测试集不兼容".

我使用 WEKA 进行文本分类,我已经训练了数据集,并应用了 StringToWOrdVector 和 NumericToNominal 过滤器,并拥有测试数据集并对其应用了相同的过滤器.当我尝试将我的模型应用于测试数据时,它给了我以下错误训练集和测试集不兼容找了个解决办法,报错是因为两组之间的属性数量不同,而且总是不同,因为两组中的文本不同 我该如何解决这个错误? 解决方案 你能做 ..
发布时间:2021-09-24 20:10:54 其他开发

Weka - 找不到允许的类

我正在将 Weka 集成到我为另一个应用程序编写的插件中.我在我的类路径中包含了 weka.jar,并且在大多数情况下,事情似乎运行良好.不幸的是,当我要更改某些分类器的选项时,我遇到了无法找到某些类的特定问题.例如,当我尝试在 AdaBoost 选项中更改分类器的名称时,我收到一个以这样结尾的错误: java.lang.Exception: Can't find a permissible c ..
发布时间:2021-09-24 20:10:52 Java开发

Weka 输出预测

我已经使用 Weka GUI 来训练和测试文件(进行预测),但不能用 API 做同样的事情.我得到的错误表明训练和测试文件中有不同数量的属性.在 GUI 中,这可以通过检查“输出预测"来解决. 如何使用 API 做类似的事情?你知道那里有任何样品吗? import weka.classifiers.bayes.NaiveBayes;导入 weka.classifiers.meta.Filt ..
发布时间:2021-09-24 20:10:49 Java开发

Weka分类和预测类

我正在尝试使用 Weka 对未标记的字符串进行分类,我不是数据挖掘方面的专家,因此我一直在努力处理不同的术语.我正在做的是在运行 M5Rules 分类器后提供训练数据并设置未标记的字符串,我实际上得到了一个输出,但我不知道它是什么意思: 运行:{17 1,35 1,64 1,135 1,205 1,214 1,215 1,284 1,288 1,309 1,343 1,461 1,493 1,5 ..
发布时间:2021-09-24 20:10:46 其他开发

将 NA 值转换为 ?加载时自动

有没有办法自动将 NA 值转换为 ?在加载 .csv 文件时在 weka 中?或者我们是否必须使用其他脚本/程序来替换它们?或加载到weka之前的空白区域. 欢迎任何帮助或建议.谢谢 解决方案 不幸的是,我不相信 Weka 有办法进行这种转换.这是因为 Weka 的原生格式是 .arff 文件.在 .arff 文件中,缺失值用“?"表示. 加载 .csv 文件时,它期望缺失值也用“? ..
发布时间:2021-09-24 20:10:43 其他开发

在 C# 中使用 weka:无法将“java.util.ArrayList"类型的对象转换为“System.Collections.Generic.List"

我目前正在做一个项目,我需要在其中使用 FP-Growth算法.我知道 Weka 是一个方便的工具.但是,我使用 C# 进行编码(由于我需要其他一些库).因此,我使用 IKVM.NET 将 weka.jar 转换为 weka.dll.下面是我写的代码片段: FPGrowth FPMiner = new FPGrowth();FPMiner.buildAssociations(数据集);关联规则 ..
发布时间:2021-09-24 20:10:40 Java开发

如何在 Weka 中使用带有新数据的创建模型

我正在尝试一些关于 weka 的测试,希望有人可以帮助我,我可以让自己清楚. 第 1 步:标记我的数据 @attribute 文本字符串@attribute @@class@@ {derrota,empate,win}@数据'O Grêmio perdeu para o Cruzeiro por 1 a 0',derrota'O Grêmio venceu o Palmeiras em u ..
发布时间:2021-09-24 20:10:37 Java开发

如何删除属性值高于阈值的所有实例?

假设我们有以下数据集: X1:{4,7,0,1}X2:{4,3,2,1}X3:{6,6,6,6} 我想删除任何具有值为 > 的属性的实例;5,在这个例子中X1和X3应该被删除.我有 500 多个属性,我尝试使用: SubsetByExpression -E "(ATT1 ..
发布时间:2021-09-24 20:10:34 其他开发

WEKA:使用反序列化模型对实例进行分类

我使用了 Weka Explorer: 加载了 arff 文件 应用 StringToWordVector 过滤器 选择 IBk 作为最佳分类器 生成/保存 my_model.model 二进制文件 在我的 java 代码中,我反序列化了模型: URL curl = ClassUtility.findClasspathResource("models/my_model.mod ..
发布时间:2021-09-24 20:10:31 Java开发

如何获得J48的大小和叶子数

如果我通过以下方式构建 J48 树: 库(RWeka)适合 合身J48 修剪过的树------------------Petal.Width 0.6|花瓣.宽度 1.5:杂色(3.0/1.0)|花瓣宽度 >1.7:弗吉尼亚(46.0/1.0)叶子数 : 5树的大小:9 我想将 Number of Leaves 放入变量 N 中(所以 ..
发布时间:2021-09-24 20:10:24 其他开发

删除 Weka 中的缺失值

我正在使用 Weka 中的数据集进行包含缺失值的分类.据我了解,当使用像 NaiveBayes 这样的分类器时,Weka 会自动将它们替换为训练数据的众数或均值(使用过滤器 unsupervised/attribute/ReplaceMissingValues). 我想尝试删除它们,看看这如何影响分类器的质量.有过滤器可以做到这一点吗? 解决方案 请参阅下面的这个答案以获得更好的、现 ..
发布时间:2021-09-24 20:10:18 其他开发

使用 Weka 过滤属性

我有一个关于在 WEKA 中过滤属性的简单问题. 假设我有 500 个属性,30 个类,每个类有 100 个样本,相当于 3000 行和 500 列.这会导致您可以猜到的时间和内存问题. 如何过滤在 3000 行中仅出现一次或两次(或 n 次)的属性.这是个好主意吗? 谢谢 解决方案 使用以下过滤器 weka.filters.unsupervised.attribute ..
发布时间:2021-09-24 20:10:15 其他开发