weka相关内容
我想知道是否有办法将pCAP文件转换为ARFF文件,以便WEKA可以输入和使用它们?我目前正在从事互联网流量分析工作,我收集数据的唯一方式是通过珊瑚礁和Wireshark。虽然很有帮助,但它们没有帮助我进行此转换的功能。那么这是可能的吗? 推荐答案 使用Wireshark很容易将pCAP转换为csv文件格式。您可以转到选项,然后在CSV中导出数据包解析。它在带有功能的WEKA中是可读的
..
我要加载我以前训练的模型,然后使用新的训练数据更新此模型。但我发现这项任务很难完成。 我从Weka Wiki了解到 可以以增量方式训练实现weka.ategfiers.Updateable分类器接口的分类器。 但是,我训练的回归模型使用的是weka.classifiers.functions.MultilayerPerceptron分类器,该分类器没有实现可更新分类器。 然
..
我想知道weka.filters.supervised.instance.Resample和weka.filters.unsupervised.instance.Resample有什么区别? 在哪些情况下,我们应该分别使用它们? 推荐答案 监督和非监督重采样的文档都相同,但 监督重采样的文档有以下附加语句: 可以使过滤器保持子样本中的类分布, 或使班级分布偏向均匀分布。 监
..
我使用的是python-weka-wrapper,然后它使用javabridge库来运行和访问Java虚拟机,以利用WEKA必须提供的所有功能。 因此,我的应用程序在ReactJS中有一个前端,在Flask中有一个后端服务器。对于对特定端点的每个请求,由Threading模块创建一个新线程。在这个线程上,启动JVM(使用weka.core.jvm),执行脚本,然后停止。在向同一端点发出第二个请求后
..
我有一个数据集。该数据集具有一些类别值和一些离散值。我的数据集是不平衡的数据集。使用Weka提供的Resample过滤器将数据集分为60%的训练数据和40%的测试数据。为了使数据集平衡,我使用了SMOTE技术。之后,我使用随机森林对数据集进行分类。 结果为 现在我不明白结果中?是什么意思?其次,为什么假阳性和真阳性没有价值?这是否意味着即使在应用SMOTE之后,数据集仍然偏向No类?
..
我有两个数据集,它们当前与我的 java 文件和我的 PC 位于同一文件夹中.目前,我正在通过我的 C 盘访问它们.由于这是一个应用程序,我应该在哪里保存我的 .ARFF 文件以及我应该使用什么路径?我已经在 raw 文件夹中尝试过,但似乎没有任何效果. 这是我目前所拥有的...... 解决方案 经过太多小时 从资产文件夹中检索数据的非常简单的解决方案!只有一种用户定义的方法.
..
WEKA Explorer 无法打开与 MySQL 的连接. 连接到:jdbc:mysql://MYSERVER:3306/NAME = true 顺便说一句:mysql驱动已下载mysql-connector-java-5.1.14-bin &类路径已设置. (用户和密码都可以,因为它适用于 MySQL Workbench) 单击 JButton OK(以“打开 DB"的
..
我想在 weka 中打开一个 csv 文件(从 openoffice calc 保存). 我不断收到错误消息:“值的数量错误.读取 140,预计第 3 行有 139." csv 已经用标签周围的引号固定了.我在第一行数了 140 个值. 这里有什么问题? 链接到 文件. 解决方案 原来在我导出的 excel 文件中有一个值是看不见的. 我注意到它是因为所有行都
..
我正在尝试为不断崩溃的 weka 增加 Java 中的堆大小.我使用了建议的行: >java -Xmx500m -类路径 但我收到以下错误: -classpath 需要类路径规范 我不确定这意味着什么.有什么建议吗? 解决方案 我发现实际问题出在 '\Program Files (x86)\Weka-3-6'.我用记事本打开它,文件中间有一行'maxheap = 512m'.
..
我正在尝试解析 CSV 文件,最好使用 weka.core.converters.CSVLoader.但是,我拥有的文件不是有效的 UTF-8 文件.它主要是一个 UTF-8 文件,但一些字段值采用不同的编码,所以没有整个文件有效的编码,但无论如何我都需要解析它.除了使用像 Weka 这样的 java 库,我主要在 Scala 工作.我什至无法使用 scala.io.Source 读取文件:例如
..
在这种情况下,我在成本敏感分类器函数中使用 RWeka 包和 J48.我知道使用“party"包我可以绘制一个普通的 J48 树,但不确定如何使用 CSC 输出绘制一个图. 库(RWeka)csc
..
我一直在阅读文本分类,发现了几个可以用于分类的Java工具,但我仍然想知道:文本分类和句子分类一样吗! 有没有专注于句子分类的工具? 解决方案 “文本分类"和“句子分类"之间没有形式上的区别.毕竟,句子是一种文本.但一般来说,当人们谈论文本分类时,恕我直言,他们指的是更大的文本单元,例如一篇文章、评论或演讲.将政治家的演讲归类为民主党或共和党比将推文归类要容易得多.当每个实例有大量文
..
我正在为我正在上的大学课程做一个项目. 我正在使用 PHP 构建一个简单的网络应用程序,该应用程序根据一组字典将推文分为“积极"(或快乐)和“消极"(或悲伤).我现在想到的算法是朴素贝叶斯分类器或决策树. 但是,我找不到任何 PHP 库可以帮助我进行一些严肃的语言处理.Python 有 NLTK(http://www.nltk.org).PHP 有没有类似的东西? 我打算使用 W
..
我正在使用 Weka 中的朴素贝叶斯分类器进行 NLP 分类项目.我打算使用半监督机器学习,因此使用未标记的数据.当我在一组独立的未标记测试数据上测试从标记训练数据中获得的模型时,Weka 会忽略所有未标记的实例.有人可以指导我如何解决这个问题吗?之前已经有人在这里问过这个问题,但没有提供任何合适的解决方案.这是一个示例测试文件: @relation 所指对象@attribute feature
..
如何向我创建的现有实例对象添加新实例? 这是一个例子: ArrayListatts = new ArrayList(2);ArrayListclassVal = new ArrayList();classVal.add("A");classVal.add("B");atts.add(new Attribute("content",(ArrayList)null));atts.add(new
..
对于 Weka Explorer (GUI),当我们为任何给定的 ARFF 文件做一个 10 倍的 CV 时,那么 Weka Explorer 提供的(就我所见)是所有的平均结果10 折. 问.有什么办法可以得到每次折叠的结果?例如,我需要每个折叠的错误率(错误识别的实例). 感谢帮助. 解决方案 我认为使用 Weka 的 GUI 可以实现这一点.您需要使用 Experimen
..
我有两个数据集,它们当前与我的 Java 文件和我的 PC 位于同一文件夹中.目前,我正在通过我的 C 驱动器访问它们.由于这是一个应用程序,我应该在哪里保存我的 .ARFF 文件以及我应该使用什么路径?我在原始文件夹中尝试过,但似乎没有任何效果. 这是我目前所拥有的... 解决方案 时间过长 从资产文件夹中检索数据的一个非常简单的解决方案!只有一种用户定义的方法. 在r
..
我有两个数据集.基本上,它们是两个 .arff 文件. Fold1.arff 包含: @relation iris@attribute sepallength 数字@attribute sepalwidth 数字@attribute petallength 数字@attribute petalwidth 数字@attribute class {Iris-setosa,Iris-versic
..
我正在尝试在我的 Java 代码中使用 weka API.我使用 J48 树分类对 MySQL 数据库中的数据集进行分类,但出现此错误: 正在尝试添加数据库驱动程序 (JDBC):RmiJdbc.RJDriver - 错误,不在 CLASSPATH 中?尝试添加数据库驱动程序 (JDBC):jdbc.idbDriver - 错误,不在 CLASSPATH 中?尝试添加数据库驱动程序 (JDBC)
..
我想对经纬度指定的点进行聚类.我正在使用 WEKA API问题在于 Instances instances = new Instances(40.01,1.02);那么,如何在不使用 ARFF 文件的情况下指定输入数据?我只想将数组读入 Instances. import java.io.Reader;导入 weka.clusterers.ClusterEvaluation;导入 weka.cl
..