approximate相关内容

如何使用与 Solr 的 n-gram 近似匹配?

我们有一个电影和连续剧数据库,并且由于数据来自许多不同可靠性的来源,我们希望能够对剧集的标题进行模糊字符串匹配.我们在应用程序中使用 Solr 进行搜索,但默认匹配机制在单词级别上运行,这对于短字符串(如标题)来说不够好 我过去使用过 n-gram 近似匹配,我很高兴发现 Lucene(和 Solr)支持开箱即用的东西.不幸的是,我无法正确配置它. 我认为我需要一个特殊的字段类型,所以 ..
发布时间:2022-01-15 13:14:41 其他开发

如何使用n-grams近似匹配与Solr?

我们有一个电影和连续剧的数据库,由于数据来自许多不同可靠性的来源,我们希望能够对剧集标题进行模糊字符串匹配.我们在应用程序中使用 Solr 进行搜索,但是默认匹配机制是在单词级别上运行的,这对于标题等短字符串来说不够好 我过去使用过 n-gram 近似匹配,我很高兴地发现 Lucene(和 Solr)支持这种开箱即用的东西.不幸的是,我无法正确配置它. 我假设我需要一个特殊的字段类型, ..
发布时间:2021-12-30 08:59:56 其他开发

递归程序,用于计算在Prolog中不起作用的余弦的Taylor近似值

我还是Prolog的新手,我不确定为什么此代码无法正常工作.我认为,基本情况或递归情况的最后3行都可能出现问题.其他一切都很好. 该程序确定通过序列近似计算的余弦值, 要这样做,它需要计算2K的阶乘,也就是-1 ^ K,然后在最终方程式中使用这两个计算(在%递归情况下完成). % Factorial from class fact(0, 1). fact(N, F) :- ..
发布时间:2020-07-17 19:05:04 其他开发

如何在Solr中使用n元语法近似匹配?

我们有一个电影和电视剧数据库,由于数据来自可靠性各不相同的许多来源,我们希望能够对剧集的标题进行模糊字符串匹配.我们在应用程序中使用Solr进行搜索,但是默认的匹配机制在单词级别上运行,这对于诸如标题之类的短字符串还不够好 我过去使用n-gram近似匹配,很高兴发现Lucene(和Solr)开箱即用.不幸的是,我无法正确配置它. 我假设为此需要特殊的字段类型,因此我添加了 我的sche ..
发布时间:2020-05-04 07:33:58 其他开发

Java的近似正则表达式库?

我刚刚编写了一些近似字符串匹配的代码。我想将我的天真算法与在JVM上运行的更成熟的实现进行对比。有什么建议? 解决方案 我在本网站的其他地方找到了类似问题的答案。 Commons Lang实现了Levenshtein距离。 http://commons.apache.org/lang/api-release/org/apache/commons/lang/StringUtils ..
发布时间:2019-01-08 20:35:16 Java开发

Excel大致文本匹配

示例: $ b我试图检查列A中的字符串数量是否与B列中的字符串相匹配。 $ b 如果我在列B中有字符串“angry_birds_iph_app”,并且“Agry_birds_iph_app”和“angry_birds_adrd_app”出现在列A的某处,我希望该函数返回2。 解决方案 看看Excel Fuzzy Lookup加载项。可以从Microsoft下载。该工具实现Levensh ..
发布时间:2017-09-04 02:34:41 Office

我如何找到最近的数组元素为任意(非会员)的数量?

的看似类似的问题:“查找在数组“(在Java中)和”找到最接近的匹配双打的阵列“(实际上是一个地理问题)。的 我有双打的(排序)数组。给出的任意数量(其可以是或可以不是对于阵列元件中的一个完全匹配),我怎样才能返回它是最接近的匹配 例如,使用下面的数组: 1.8 2.4 2.7 3.1 4.5 查询2.5将与一个索引1返回,对应于2.4的值。 ,用于检测完全位 ..
发布时间:2016-09-20 21:22:29 C#/.NET

近似​​字符串匹配

我知道这个问题已经被问了很多的时间。 我想一个建议上算法适用于近似串匹配。 该应用程序是专门为公司名称仅匹配而已。 最大的挑战可能是公司端名称的一部分,短名为part 示例: 1.公司A PTY LTD VS公司A PTY。 LTD。 VS公司A 2. WES工程VS W.E.S.工程(极其罕见的次数) 你以为的Levenshtein编辑距离是否足够? 我使用C# ..
发布时间:2016-09-08 18:34:21 C#/.NET