Java中的模糊字符串搜索库 [英] Fuzzy string search library in Java
问题描述
我正在寻找一个用于模糊字符串搜索的高性能Java库。
I'm looking for a high performance Java library for fuzzy string search.
有许多算法可以找到相似的字符串,Levenshtein距离,Daitch-Mokotoff Soundex, n-gram等。
There are numerous algorithms to find similar strings, Levenshtein distance, Daitch-Mokotoff Soundex, n-grams etc.
存在哪些Java实现?他们的利弊?我知道Lucene,任何其他解决方案或Lucene最好吗?
What Java implementations exists? Pros and cons for them? I'm aware of Lucene, any other solution or Lucene is best?
我发现这些,有没有人有过这方面的经验?
I found these, does anyone have experience with them?
- SimMetrics
- NGramJ
推荐答案
Commons Lang实现了 Levenshtein距离。
Commons Lang has an implementation of Levenshtein distance.
Commons Codec实现了 soundex 和 metaphone 。
Commons Codec has an implementation of soundex and metaphone.
这篇关于Java中的模糊字符串搜索库的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!