search-engine相关内容
mavensearch.net 在许多情况下都不知道当前版本,您使用和喜欢什么Maven存储库搜索引擎? 解决方案 我建议使用官方版本 http://search.maven.org/.随着将新工件添加到中央存储库中,Maven Central的索引每小时更新一次.
..
目前,我们有一个Magento网站,该网站的库存很大,但我们在ON SITE搜索结果的相关性方面存在一些问题.目前,我们设置为“像完整文本一样结合",但结果却不是我们期望的.例如,搜索"Lee Child"(作者),将显示三本Lee Child书,然后显示三本作者为"Lauren Child"的书,然后显示其余的Lee Child书. 因此,从本质上讲,我们希望优先考虑全文搜索并在类似搜索结
..
我遇到了无法解决的问题.部分原因是我无法用正确的术语来解释它.我是新来的,对这个笨拙的问题感到抱歉. 下面您可以看到我的目标概述. 我正在使用Magento CE 1.7.0.2& Solr 4.6.0. 在Solr中使用拼写检查器 我正在使用 iphon 而不是 iphone 进行拼写检查的solr拼写检查器进行搜索.
..
我正在使用Apache solr,正在尝试使用语音过滤器工厂,我已经尝试了solr.PhoneticFilterFactory可用的所有编码器,但是它们都不支持印度语言.是否有其他可用的过滤器/方法,以便我可以获取印度语(例如印地语,泰米尔语,孟加拉语等)的语音表示 否则,我们如何修改现有过滤器以支持这些语言. 解决方案 您是否尝试过新的Beider Morse过滤器工厂,该工厂刚刚
..
我正在使用基于Java的Nutch网络搜索软件.为了防止在搜索查询结果中返回重复的(url)结果,当我运行Nutch搜寻器为我的Intranet编制索引时,我试图从被索引的网址中删除(也称为规范化)"jsessionid"的表达式.但是,我对$ NUTCH_HOME/conf/regex-normalize.xml的修改(在运行我的爬网之前)似乎没有任何效果. 如何确保正在使用我的regex
..
让我解释一下我的问题.我正在使用Lucene在asp.net网页中搜索并显示结果.当我搜索时,Lucene会显示与我的搜索相关的所有记录.例如,我有5000条名称为John的记录.如果我输入John,它将显示所有这5000条记录.我想基于其他一些属性来限制这5000条记录.我有四个属性,分别是名字,姓氏,DOB和ID.在这5000条记录中,我希望它仅显示用户输入的DOB记录.这意味着只显示1998
..
我的Solr设置有问题.而不是在选择处理程序中搜索"canaDa",就像在"canada"中一样. 这是字段类型text_en_splitting的架构(它们都很重要):
..
有人可以对这些搜索引擎进行简单的比较分析吗?两种框架都有哪些优势? 顺便说一句,我从以下几篇学术论文中看到了选择 mg4j 的以下基本解释: 合并同一集合中的索引 多索引查询 更新: 这些幻灯片(摘自解决方案 Jeff Dalton 我还没有使用过mg4j.我曾经用过Lucene. Lucene IMO的第一大特点是它的广泛采用以及用户/开发人员/提交者的精彩社区.这意
..
我正在查询SolR服务器以获取价格范围. 如何构造一次返回的查询: 所有商品的价格范围(无分面查询) 具有方面查询的商品的价格范围(或列表) 对于这样的滑块,我需要这四个值: all_min=============user_min========user_max========all_max 解决方案 使用 StatsComponent 获取最小和最大使用 fac
..
我对Lucene评分策略感到有些困惑.我知道Lucene的得分公式如下: score(q,d) = coord(q,d) x queryNorm(q) X SUM ( tf(t_in_d) x idf(t)^2 x t.getBoost() x norm(t,d)) 我了解此公式中除 queryNorm(q)之外的所有组件.如官方文档所述, queryNorm(q
..
我知道Lucene对通配符搜索有广泛的支持,并且我知道您可以搜索以下内容: Stackover * (将返回 Stackoverflow ) 也就是说,我的用户对学习查询语法不感兴趣. Lucene可以使用现成的分析器执行这种类型的通配符搜索吗?还是应该在每个搜索查询后附加"*"? 解决方案 使用字符串操作来做到这一点非常棘手,特别是因为QueryParser支持增强,短语等.
..
最近几天,我们正在考虑将Solr用作我们的首选搜索引擎. 我们需要的大多数功能都是开箱即用的,或者可以轻松配置. 但是,我们绝对需要有一个功能似乎在Solr中很好地隐藏(或缺失). 我将尝试举例说明.我们有很多实际上是业务的文档: Apache 1 ...
..
我正在使用MySQL数据库,并且一直在使用数据库驱动的搜索.数据库引擎和Lucene搜索引擎有什么优缺点?我想对何时何地使用它们提出建议? 解决方案 我建议您阅读
..
我想搜索包含许多单词的字符串,并检索与其中任何一个匹配的文档.我的索引方法是: Document document = new Document(); document.add(new TextField("termos", text, Field.Store.YES)); document.add(new TextField("docNumber",fileNumber,Field.
..
当前,我正在使用 Lucene.net 2.9.2 框架.作为搜索的结果,我希望获得带有突出显示的文本片段的结果页(asp.net).我希望所选片段是一个整个句子,而不仅仅是几个单词. 例如,如果我有文字: Lorem ipsum dolor坐下,奉献上精英,sed do eiusmod tempor incididunt ut Labore et dolore magna aliqu
..
现在,我有几个Lucene索引集(我称为分片),它们为不同的文档集建立索引.它们是独立的,这意味着我可以对它们中的每一个执行搜索,而无需阅读其他内容.然后我得到一个查询请求.我想在每个索引集上进行搜索,然后将结果合并以形成最终的顶级文档. 我知道,在对文档进行评分时,Lucene需要知道每个术语的;不同的索引集将赋予不同的同一术语(因为不同的索引集包含不同的文档集
..
Elasticsearch是否保留多值字段的顺序? 即如果我在字段中输入了以下值: { "values": ["one", "two", "three"], "values_original": ["1", "2", "3"] } (鉴于未分析字段) 我可以确定列表的内容将始终按照我放置在列表中的顺序返回吗? 在上面的示例中,我想确保“值"中第一个位置上
..
我使用Azure搜索,而Azure搜索又使用Lucene.有什么方法可以使搜索不那么严格. 我需要的是搜索"术语"时应匹配包含"术语"的术语的文档. 银狐术语应与“前缀术语","术语后缀",“前缀术语后缀"匹配" 将狐狸 part2 匹配到"part1 part2 "," part2 part3","part1 part2 part3" " 我需要运行搜索查询,其中包含几个词,例
..
就我而言,文档具有两个字段,例如“标题"和“视图". “视图"代表人们访问此文档的次数.例如:“标题":"iphone",“观看次数":"10". 我必须制定一种策略,为视图分配一些权重,例如,相关性分数是根据score(title)* 0.8 + score(views)* 0.2计算得出的. lucene可以做到这一点吗?我想知道是否存在与此问题相关的算法. 解决方案 这是您可以执行的
..
它可以在Unix上运行,并将用于电子邮件搜索(Dovecot,Postfix和maildir). Lucene没问题,我只是在分析一些替代方案. 解决方案 用于简单的RDBMS全文本机搜索. 在PostgreSQL中进行全文搜索 SQLite中的FTS2 在MySQL中进行全文搜索 Oracle DB中的Oracle Text 在Microsoft SQL Server
..