需要解释 Solr 的语言词干 [英] Need explanation on Language Stemmer of Solr

查看:34
本文介绍了需要解释 Solr 的语言词干的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在使用 nutch 和 Solr 来开发阿拉伯文本搜索引擎.我需要在我的阿拉伯语文本上实现一个词干分析器,在搜索 Solr Stemmer 时,我发现它提供了这两个过滤器

I'm using nutch with Solr for a developing a search engine for Arabic texts. I need to implement a stemmer on my Arabic texts, and while serching on Solr Stemmer I found that it provide those two filters

我尝试了它们,但不明白它们的作用..所以请有人可以帮我举一些例子吗??

I tried them but did not understand what they do .. So please any one can help me with some examples??

然后做这两件事:

العملات 源于 عملة

العملات Stemmed to عملة

البسَاتِين ، بساتينكم 源于 بستان

البسَاتِين ، بساتينكم Stemmed to بستان

谢谢.

推荐答案

你可以在这里找到一些细节:http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.html

You can find some details here: http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.html

也就是说:

词干定义为:

  • 删除附加的定冠词、连词和介词.
  • 常见后缀的词干.

这篇关于需要解释 Solr 的语言词干的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆