分类使用Apache Mahout的数据 [英] Classify data using Apache Mahout

查看:129
本文介绍了分类使用Apache Mahout的数据的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我想解决一个简单的分类问题。

I am trying to solve a simple classification problem.

问题:结果
    我有一组文字,我必须根据内容来分类。

The Problem:
I have a set of text and I have to categorize them based on the content.

使用Mahout的解决方案:结果
    我明白,我必须将输入转化为一个序列文件生成模型。是的,我能做到这一点。现在,我怎么分类我的测试数据?该20News例子只测试的正确性。但是,我想这样做实际的分类。结果
    我不知道我是否需要写code或利用现有的一些现有的类的测试集进行分类。

Solution using Mahout:
I understood that I have to convert the input to a sequence file to generate the model. Yes, I was able to do this. Now, how do I categorize my test data? The 20News example only tests for correctness. But, I want to do the actual classification.
I am not sure if I need to write code or use some existing classes available to classify the test set.?

推荐答案

我不喜欢插入我自己的工作,但是我们把一整节成为亨利马乌行动有关分类。理论上讲,code实例,案例学习实践活动,甚至整个服务器场的实现。

I hate to plug my own work, but we put an entire section into Mahout in Action about classification. Theory, code examples, case study practice, even an entire server farm implementation.

您可以在 http://www.manning.com/owen获得pre-发行版/

这篇关于分类使用Apache Mahout的数据的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆