SOLR 和自然语言解析 - 我可以使用它吗? [英] SOLR and Natural Language Parsing - Can I use it?

查看:26
本文介绍了SOLR 和自然语言解析 - 我可以使用它吗?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

自然语言处理的词频算法

虽然这个问题的答案非常好,但我想知道是否可以将我花在了解 SOLR 上的所有时间用于我的 NLP.

While the answer for that question is excellent, I was wondering if I could make use of all the time I spent getting to know SOLR for my NLP.

我想到 SOLR 是因为:

I thought of SOLR because:

  1. 它有很多分词器并执行大量 NLP.
  2. 开箱即用非常有用.
  3. 它是一个宁静的分布式应用程序,所以很容易连接
  4. 我已经用了一段时间,所以使用它可以节省我的时间.

我可以使用 Solr 吗?

虽然上面的理由很好,但我对SOLR不是很了解,所以我需要知道它是否适合我的要求.

Can I use Solr?

Although the above reasons are good, I don't know SOLR THAT well, so I need to know if it would be appropriate for my requirements.

理想情况下,我想配置 SOLR,然后能够向 SOLR 发送一些文本,并检索索引的分词内容.

Ideally, I'd like to configure SOLR, and then be able to send SOLR some text, and retrieve the indexed tonkenized content.

我正在研究更大推荐引擎的一个小组件.

I'm working on a small component of a bigger recommendation engine.

推荐答案

我想您可以使用 Solr 并将其与其他工具结合使用.标记化、停用词移除、词干提取,甚至同义词都是 Solr 开箱即用的.如果您需要命名实体识别或基本名词短语提取,则需要使用 OpenNLP 或等效工具作为预处理阶段.您可能需要术语向量来进行检索.将 Apache Mahout 与 Apache Lucene 和 Solr 集成可能很有用,因为它讨论了 Lucene 和 Solr 与机器学习(包括推荐)引擎的集成.除此之外,请随时提出更具体的问题.

I guess you can use Solr and combine it with other tools. Tokenization, stop word removal, stemming, and even synonyms come out of the box with Solr. If you need named entity recognition or base noun-phrase extraction, you need to use OpenNLP or an equivalent tool as a pre-processing stage. You will probably need term vectors for your retrieval purposes. Integrating Apache Mahout with Apache Lucene and Solr may be useful as it discusses Lucene and Solr integration with a machine learning (including recommendation) engine. Other then that, feel free to ask further more specific questions.

这篇关于SOLR 和自然语言解析 - 我可以使用它吗?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆