使用 Weka 过滤属性 [英] Filtering Attributes with Weka

查看:28
本文介绍了使用 Weka 过滤属性的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个关于在 WEKA 中过滤属性的简单问题.

I have a simple question about filtering attributes in WEKA.

假设我有 500 个属性,30 个类,每个类有 100 个样本,相当于 3000 行和 500 列.这会导致您可以猜到的时间和内存问题.

Let's say I have 500 attributes 30 classes and 100 samples for each class which equals 3000 rows and 500 columns. This causes time and memory problems a you can guess.

如何过滤在 3000 行中仅出现一次或两次(或 n 次)的属性.这是个好主意吗?

How do I filter attributes that occur only once or twice (or n times) in 3000 rows. And is it a good idea?

谢谢

推荐答案

使用以下过滤器

weka.filters.unsupervised.attribute.RemoveUseless

此过滤器会删除根本没有变化或变化太大的属性.所有常量属性都会被自动删除,以及任何超过最大方差参数百分比的属性.

This filter removes attributes that do not vary at all or that vary too much. All constant attributes are deleted automatically, along with any that exceed the maximum percentage of variance parameter.

这篇关于使用 Weka 过滤属性的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆