search-engine相关内容

Magento搜索引擎相关性问题

目前,我们有一个Magento网站,该网站的库存很大,但我们在ON SITE搜索结果的相关性方面存在一些问题.目前,我们设置为“像完整文本一样结合",但结果却不是我们期望的.例如,搜索"Lee Child"(作者),将显示三本Lee Child书,然后显示三本作者为"Lauren Child"的书,然后显示其余的Lee Child书. 因此,从本质上讲,我们希望优先考虑全文搜索并在类似搜索结 ..
发布时间:2020-05-05 10:13:09 其他开发

如何在PHP变量中从Solr Server获取建议

我遇到了无法解决的问题.部分原因是我无法用正确的术语来解释它.我是新来的,对这个笨拙的问题感到抱歉. 下面您可以看到我的目标概述. 我正在使用Magento CE 1.7.0.2& Solr 4.6.0. 在Solr中使用拼写检查器 我正在使用 iphon 而不是 iphone 进行拼写检查的solr拼写检查器进行搜索. ..
发布时间:2020-05-05 09:31:07 PHP

印地语语音过滤器工厂

我正在使用Apache solr,正在尝试使用语音过滤器工厂,我已经尝试了solr.PhoneticFilterFactory可用的所有编码器,但是它们都不支持印度语言.是否有其他可用的过滤器/方法,以便我可以获取印度语(例如印地语,泰米尔语,孟加拉语等)的语音表示 否则,我们如何修改现有过滤器以支持这些语言. 解决方案 您是否尝试过新的Beider Morse过滤器工厂,该工厂刚刚 ..
发布时间:2020-05-04 08:00:03 其他开发

配置螺母regex-normalize.xml

我正在使用基于Java的Nutch网络搜索软件.为了防止在搜索查询结果中返回重复的(url)结果,当我运行Nutch搜寻器为我的Intranet编制索引时,我试图从被索引的网址中删除(也称为规范化)"jsessionid"的表达式.但是,我对$ NUTCH_HOME/conf/regex-normalize.xml的修改(在运行我的爬网之前)似乎没有任何效果. 如何确保正在使用我的regex ..
发布时间:2020-05-04 07:58:38 Java开发

Lucene搜索的过滤结果

让我解释一下我的问题.我正在使用Lucene在asp.net网页中搜索并显示结果.当我搜索时,Lucene会显示与我的搜索相关的所有记录.例如,我有5000条名称为John的记录.如果我输入John,它将显示所有这5000条记录.我想基于其他一些属性来限制这5000条记录.我有四个属性,分别是名字,姓氏,DOB和ID.在这5000条记录中,我希望它仅显示用户输入的DOB记录.这意味着只显示1998 ..
发布时间:2020-05-04 07:55:33 C#/.NET

mg4j vs.apache lucene

有人可以对这些搜索引擎进行简单的比较分析吗?两种框架都有哪些优势? 顺便说一句,我从以下几篇学术论文中看到了选择 mg4j 的以下基本解释: 合并同一集合中的索引 多索引查询 更新: 这些幻灯片(摘自解决方案 Jeff Dalton 我还没有使用过mg4j.我曾经用过Lucene. Lucene IMO的第一大特点是它的广泛采用以及用户/开发人员/提交者的精彩社区.这意 ..
发布时间:2020-05-04 07:46:03 其他开发

SolR查询-价格范围

我正在查询SolR服务器以获取价格范围. 如何构造一次返回的查询: 所有商品的价格范围(无分面查询) 具有方面查询的商品的价格范围(或列表) 对于这样的滑块,我需要这四个值: all_min=============user_min========user_max========all_max 解决方案 使用 StatsComponent 获取最小和最大使用 fac ..
发布时间:2020-05-04 07:43:21 其他开发

如何在Lucene中执行通配符搜索

我知道Lucene对通配符搜索有广泛的支持,并且我知道您可以搜索以下内容: Stackover * (将返回 Stackoverflow ) 也就是说,我的用户对学习查询语法不感兴趣. Lucene可以使用现成的分析器执行这种类型的通配符搜索吗?还是应该在每个搜索查询后附加"*"? 解决方案 使用字符串操作来做到这一点非常棘手,特别是因为QueryParser支持增强,短语等. ..
发布时间:2020-05-04 07:36:07 其他开发

Solr关联

最近几天,我们正在考虑将Solr用作我们的首选搜索引擎. 我们需要的大多数功能都是开箱即用的,或者可以轻松配置. 但是,我们绝对需要有一个功能似乎在Solr中很好地隐藏(或缺失). 我将尝试举例说明.我们有很多实际上是业务的文档: Apache 1 ... ..
发布时间:2020-05-04 07:34:38 其他开发

在Lucene.net 2.9.2中突出显示整个句子

当前,我正在使用 Lucene.net 2.9.2 框架.作为搜索的结果,我希望获得带有突出显示的文本片段的结果页(asp.net).我希望所选片段是一个整个句子,而不仅仅是几个单词. 例如,如果我有文字: Lorem ipsum dolor坐下,奉献上精英,sed do eiusmod tempor incididunt ut Labore et dolore magna aliqu ..
发布时间:2020-05-04 07:32:13 C#/.NET

Lucene:如何在几个独立的索引集上执行搜索并合并结果?

现在,我有几个Lucene索引集(我称为分片),它们为不同的文档集建立索引.它们是独立的,这意味着我可以对它们中的每一个执行搜索,而无需阅读其他内容.然后我得到一个查询请求.我想在每个索引集上进行搜索,然后将结果合并以形成最终的顶级文档. 我知道,在对文档进行评分时,Lucene需要知道每个术语的;不同的索引集将赋予不同的同一术语(因为不同的索引集包含不同的文档集 ..
发布时间:2020-05-04 07:30:33 Java开发

Elasticsearch是否保持多值字段的顺序?

Elasticsearch是否保留多值字段的顺序? 即如果我在字段中输入了以下值: { "values": ["one", "two", "three"], "values_original": ["1", "2", "3"] } (鉴于未分析字段) 我可以确定列表的内容将始终按照我放置在列表中的顺序返回吗? 在上面的示例中,我想确保“值"中第一个位置上 ..
发布时间:2020-05-04 07:26:18 其他开发

Azure搜索-在“包含"一词中查找匹配项

我使用Azure搜索,而Azure搜索又使用Lucene.有什么方法可以使搜索不那么严格. 我需要的是搜索"术语"时应匹配包含"术语"的术语的文档. 银狐术语应与“前缀术语","术语后缀",“前缀术语后缀"匹配" 将狐狸 part2 匹配到"part1 part2 "," part2 part3","part1 part2 part3" " 我需要运行搜索查询,其中包含几个词,例 ..
发布时间:2020-05-04 07:26:08 其他开发

Lucene:如何提升某些特定领域

就我而言,文档具有两个字段,例如“标题"和“视图". “视图"代表人们访问此文档的次数.例如:“标题":"iphone",“观看次数":"10". 我必须制定一种策略,为视图分配一些权重,例如,相关性分数是根据score(title)* 0.8 + score(views)* 0.2计算得出的. lucene可以做到这一点吗?我想知道是否存在与此问题相关的算法. 解决方案 这是您可以执行的 ..
发布时间:2020-05-04 07:25:32 其他开发

哪些是Lucene的最佳替代品?

它可以在Unix上运行,并将用于电子邮件搜索(Dovecot,Postfix和maildir). Lucene没问题,我只是在分析一些替代方案. 解决方案 用于简单的RDBMS全文本机搜索. 在PostgreSQL中进行全文搜索 SQLite中的FTS2 在MySQL中进行全文搜索 Oracle DB中的Oracle Text 在Microsoft SQL Server ..
发布时间:2020-05-04 07:23:00 其他开发