需要解释 Solr 的语言词干 [英] Need explanation on Language Stemmer of Solr
问题描述
我正在使用 nutch 和 Solr 来开发阿拉伯文本搜索引擎.我需要在我的阿拉伯语文本上实现一个词干分析器,在搜索 Solr Stemmer 时,我发现它提供了这两个过滤器
I'm using nutch with Solr for a developing a search engine for Arabic texts. I need to implement a stemmer on my Arabic texts, and while serching on Solr Stemmer I found that it provide those two filters
我尝试了它们,但不明白它们的作用..所以请有人可以帮我举一些例子吗??
I tried them but did not understand what they do .. So please any one can help me with some examples??
然后做这两件事:
العملات 源于 عملة
العملات Stemmed to عملة
البسَاتِين ، بساتينكم 源于 بستان
البسَاتِين ، بساتينكم Stemmed to بستان
谢谢.
推荐答案
你可以在这里找到一些细节:http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.html
You can find some details here: http://lucene.apache.org/core/3_6_0/api/contrib-analyzers/org/apache/lucene/analysis/ar/ArabicStemmer.html
也就是说:
词干定义为:
- 删除附加的定冠词、连词和介词.
- 常见后缀的词干.
这篇关于需要解释 Solr 的语言词干的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!