weka相关内容

Weka 归一化列

我有一个包含 14 个数字列的 ARFF 文件.我想分别对每一列执行标准化,即将每一列的值修改为 (actual_value - min(this_column))/(max(this_column) - min(this_column)).因此,一列中的所有值都在 [0, 1] 范围内.一列的最小值和最大值可能与另一列的不同. 我怎样才能用 Weka 过滤器做到这一点? 谢谢 ..
发布时间:2021-06-08 18:59:37 其他开发

使用weka jar在java代码中加载朴素贝叶斯模型

我使用了 weka 并通过使用 weka GUI 制作了一个朴素贝叶斯分类器.然后我按照这个教程保存了这个模型.现在我想通过 Java 代码加载这个模型,但我找不到任何方法来使用 weka 加载保存的模型. 这是我的要求,我必须单独制作模型,然后在单独的程序中使用它. 如果有人能在这方面指导我,我将不胜感激. 解决方案 您可以使用以下命令轻松加载 Java 中保存的模型: C ..
发布时间:2021-06-07 18:33:36 Java开发

在 Java 中使用 WEKA 打印预测

我正在尝试使用 Java 中的 Weka 进行预测,使用朴素贝叶斯分类器,代码如下: Java 公共类运行{public static void main(String[] args) 抛出异常 {ConverterUtils.DataSource source1 = new ConverterUtils.DataSource("./data/train.arff");实例 train = ..
发布时间:2021-06-07 18:33:33 Java开发

同时由不同的 shell 运行相同的 java 类

这可能是一个愚蠢的问题,但我只想确定.我想使用不同的数据集同时从不同的 shell 脚本运行相同的 java 类(weka 文本分类器).我的想法对此有点困惑.该类是否会像多线程一样运行?如果是这种情况,weka 分类器线程安全吗? 解决方案 从不同的 shell 运行多个 Weka 分类器实例,将它们作为不同的进程运行.这是安全,并且它们的执行不会相互干扰.确保他们将模型写入不同的位置/ ..
发布时间:2021-06-04 20:44:51 Java开发

R 中的 R 模型树 M5P

我想知道 Weka 提供的构建模型树(如 M5P 在叶子中有回归模型)的功能是否可以在 R 中实现.我知道有一种方法可以使用 RWeka 包来处理它.令我感到奇怪的是,该功能在其他 R 包(如 rpart)中不存在.获得“模型树"的唯一方法是使用 Rweka 包?感谢您的澄清. 解决方案 请检查 cubist 和 CORElearn 包. ..
发布时间:2021-06-03 19:01:36 其他开发

在Weka中对单个实例进行分类

我使用WEKA gui训练并创建了J48模型.我将模型文件保存到计算机上,现在我想用它来对Java代码中的单个实例进行分类.我想对属性"cluster"进行预测.我要做的是以下事情: 公共无效分类(double lat,double lon,double co){//创建要与分类器一起使用的属性属性latitude = new Attribute("latitude");属性经度=新属性(“经度 ..

如何使用Java代码在Weka中使用新实例测试现有模型?

我有一个通过Weka GUI获取的分类器之一的.model文件.现在,我想在某些实例上测试此模型.谁能告诉我该怎么做? Classifier cModel =(Classifier)new NaiveBayes();cModel.buildClassifier(isTrainingSet); 我不想像这段代码中那样一次又一次地建立分类器.如何使用.model文件执行此操作? //测试模型 ..
发布时间:2021-05-18 19:56:18 Java开发

输入Weka Apriori的arff文件

我正在尝试对版本历史进行关联挖掘.我在mysql中有交易数据.Weka先验算法需要某种格式的arff或csv文件.每个项目都必须有列.对于交易中的每个项目,这些值将被指定为TRUE或FALSE.我正在寻找一种使用Weka InstanceQuery创建此文件的方法.如果交易数据很大,还有哪些选择. 解决方案 对于第二部分,我可以回答:如果交易数据巨大,则可以选择.Weka是一款优秀的软件, ..
发布时间:2021-04-29 18:42:18 AI人工智能

Weka中K-means算法的不同结果

如果我使用Weka中的任何算法,则结果格式如下: ===分层交叉验证======摘要===正确分类的实例302 63.3124%分类错误的实例175 36.6876%卡伯统计0.3536平均绝对误差0.3464均方根误差0.4176相对绝对误差85.5832%根相对平方误差92.8684%实例总数477===详细的分类精度===TP速率FP速率精度调用F度量ROC区域等级0.801 0.407 ..
发布时间:2021-04-22 19:45:07 其他开发

导入weka.jar文件

我是佐治亚州亚特兰大市一所当地大学的学生.我正在为班级项目将Weka.jar文件合并到我的日食中. 我已经尝试了很多时间将weka-3.4.jar文件整合到使用Eclipse的Java项目中的Java构建路径中. 每次,我的程序都会给我一个错误,提示无法从java测试程序中的import语句中解析weka.core. 很明显,我确实错过了一些非常重要的事情,但是我无法弄清楚. ..
发布时间:2021-02-09 20:48:17 Java开发

增加堆以避免WEKA中的内存不足错误

我正在尝试通过以下命令行使用J48分类器在WEKA中运行分类器: $ java -Xmx2048m -cp /home/weka-3-7-9/weka.jar weka.classifiers.trees.J48 -t input.arff -i -k -d J48-data.model & 尽管我的船长是43.8 M,我将堆空间增加到了2048m, 我仍然收到以下错误: Exce ..
发布时间:2020-11-22 20:36:50 其他开发

Graphviz和Weka仅生成空树

我下载了Graphviz并为其安装了Weka 3.9软件包,并按照 https://github.com/fracpete/graphviz-treevisualize-weka-package 内容: Executable ="C:\ Program Files(x86)\ Graphviz2.38 \ bin \ dot.exe" (尝试使用引号和不使用引号) 它只会通过plugi ..
发布时间:2020-11-20 19:30:17 其他开发

Weka中的交叉验证

从我阅读的内容中,我一直认为交叉验证是这样执行的: 在k折交叉验证中,原始样本是随机的 分为k个子样本.在k个子样本中,有一个子样本 保留为用于测试模型的验证数据,并且 剩余的k − 1个子样本用作训练数据.这 然后将交叉验证过程重复k次(倍数), k个子样本中的每个样本都仅使用一次作为验证数据.这 来自折叠的k个结果可以被平均(或以其他方式组合) 产生一个单一的估算值 因此,建立了k ..
发布时间:2020-11-09 18:32:49 其他开发

给定属性索引,WEKA生成的模型似乎无法预测类和分布

概述 我正在使用WEKA API 3.7.10(开发人员版本)来使用预制的 .model 文件。 我制作了25个模型:五个算法的五个结果变量。 J48决策树。 > 备用决策树 随机森林 LogitBoost 随机子空间 我在J48,随机子空间和随机森林方面遇到问题。 必需的文件 以下是创建后我的数据的 ARFF 表示形式: @relationsh ..
发布时间:2020-10-19 19:21:06 Java开发

Weka属性日期无效

我创建了一个.arff文件,其属性日期为: @attribute data date“ yyyy-MM-dd” 和其他属性。 数据的一个示例是: @data “ 2014-01-02”,11.27,11.44,11.03,11.18,11.07,11.07,11.12,9419, 2003400,2240946600,1 但是,Weka似乎无法识别日期属性。这是 ..
发布时间:2020-10-18 07:27:48 其他开发

无论属性名称如何,如何查找频繁项集?

我有一个数据集(CSV文件),可以使用Apriori算法查找频繁的项目集。 col1,col2,col3 面包,黄油,? 可乐,面包和黄油 我正在为此目的使用WEKA。输出采用以下格式: ... 大型项目集L(2): col1 =面包col2 =黄油1 col1 =可乐col2 =面包1 col1 =可乐col3 =黄油1 col2 =面包co ..
发布时间:2020-10-17 22:03:51 AI人工智能

关于Weka中的RandomTree

当我在RandomTree配置中观察一个minNum字段时,我正在玩weka。我读了描述“叶子中实例的最小总重量”的描述。 但是,我无法真正理解它的含义。 我在玩这个数字,我意识到当我增加这个数字时,这样生成的树减少了。我无法关联为什么会发生这种情况。 任何帮助/引用都会受到赞赏。 解决方案 这与叶节点上的最少实例数有关(在决策树中,默认情况下通常为2,例如J48)。设置此参 ..
发布时间:2020-10-17 21:58:57 AI人工智能

查找变量和类变量之间的相关性

我有一个数据集,其中包含7个数字属性和一个标称值(即类变量)。我想知道如何才能将最好的属性用于预测类属性。是否会找到每个属性带来的最大信息收益? 解决方案 所以您要提出的问题属于以下领域:功能选择,更广泛地说是功能工程。在线上有很多关于此的文献,并且在线上肯定有很多关于如何做到这一点的博客/教程/资源。 为了给您提供一个我刚刚通读的好链接,这是一个”博客,其中包含有关在Weka中进行 ..
发布时间:2020-10-17 21:58:52 AI人工智能

关于在Weka中研究样品的初学者问题

我刚刚使用Weka在“分类”标签下训练了我的SVM分类器。 现在,我想进一步调查哪些数据样本被错误分类了,我需要研究它们的模式,但是我不知道从Weka那里可以看到什么。 有人可以给我些帮助吗? 预先感谢。 解决方案 您可以从以下位置启用该选项: 您将得到以下实例预测: ===关于测试拆分的预测=== inst#实际预测的错误预测 1 2:Iris-ver 2: ..
发布时间:2020-10-17 21:56:32 AI人工智能