lucene相关内容

MultiFieldQueryParser 正在从首字母缩写词中删除点

由于我的问题没有得到回答,所以我再次发布这个问题. 我正在使用 Lucene 开发图书搜索 API.用户可以搜索标题或描述字段包含 C.F.A 的书...我正在使用 StandardAnalyzer 以及停用词列表. 我使用 MultiFieldQueryParser 来解析上面的字符串.但是解析后,它会删除字符串中的点.我在这里错过了什么? 谢谢. 解决方案 正如你所说 ..
发布时间:2022-01-15 13:07:29 其他开发

Schema Browser 不显示我在 Solr 中在 schema.xml 中添加的字段

我在我在 solr v5.1 中创建的名为“Core3"的核心的 schema.xml 中添加了一些字段.我不是指示例文件夹,而是使用“服务器"文件夹来运行 solr 服务器并创建 solr 核心. 我使用 bin 文件夹中提供的“solr create"实用程序创建了内核. 我使用命令创建了代号“Core3", solr create -c Core3 当我在“C:\tomcat ..
发布时间:2022-01-15 13:07:15 服务器开发

使用最新版本 Lucene 的示例

我是 Lucene 新手,想在 Maven 环境中直接从我的 Java 代码调用它.我已经尝试了一段时间来寻找可以下载和运行的工作示例.官网最新的教程是2013-Lucene 3.* https://cwiki.apache.org/confluence/display/lucene/LuceneFAQ#LuceneFAQ-HowdoIstartusingLucene?.Maven 中当前的最新版 ..
发布时间:2022-01-15 13:06:43 Java开发

Lucene.Net 模糊搜索速度

很抱歉,希望能得到有Lucene经验的人的帮助. 现在我们在应用程序中使用 Lucene.Net 3.0.3 来索引和搜索约 2.500.000 个项目.每个实体包含27个可搜索字段,以这种方式添加到索引中:new Field(key, value, Field.Store.YES, Field.Index.ANALYZED)) 现在我们有两个搜索选项: 使用模糊搜索仅搜索 4 ..
发布时间:2022-01-15 13:06:18 C#/.NET

在 Java api 中的 Solr 搜索中需要搜索的文本和围绕它的几行

我正在使用 solr 7.7.2,我使用 solrj 在 Solr 中编写了一个 Java 程序,该程序在一个巨大的文本文件中搜索一个单词.我使用以下代码来显示代表整个文本的搜索结果. SolrQuery 参数 = new SolrQuery();params.setQuery("content:word for search"); 如何在该行中只显示一行文字? 所有代码都是这样的 p ..
发布时间:2022-01-15 13:06:10 Java开发

弹性搜索中的模式匹配?

继续我之前的 post,我已根据 femtoRgon 的 post 弹性搜索不支持某些字符和锚点. 我正在寻找匹配“xxx-xx-xxxx"等模式的方法,以便使用 elastic search 查找带有社会安全号码的文档. 假设,在索引文档中,我想查找所有那些社会安全号码与“xxx-xx-xxxx"模式匹配的文档. 索引文档的示例代码: InputStream is = nul ..
发布时间:2022-01-15 13:05:53 Java开发

Lucene 查询语言和数值范围

我正在应用以下 Lucene 查询谓词以获取 2 到 6 范围内的所有包含数字: 值:[2 TO 6] 并接收具有以下值的文档: 567986400000567986400000567986400000536450400000536450400000599608800000536450400000567986400000 我对数值范围查询很感兴趣,显然,例如 Long 值 56798640 ..
发布时间:2022-01-15 13:05:34 其他开发

Grails:Lucene、Compass Query Builder 和日期范围

我的 grails 项目中有可搜索的插件.我让它在工作中索引 4 个不同的表.不幸的是,每个表都有一个名称不同的日期字段.有些被命名为 createdAt,有些被命名为 publishedOn,等等...... 在我的搜索中,我需要从这些字段中获取特定日期范围内的项目.有没有办法做到这一点?我在该插件的文档中看到了一个特定实例,但它没有考虑到我必须处理的不同字段名称. 解决方案 您可 ..
发布时间:2022-01-15 13:05:17 其他开发

显示来自 Lucene 搜索结果的示例文本

目前,我正在使用 Lucene 版本 3.0.2 创建一个类似于字典的搜索应用程序.我要显示的对象之一是一种“示例",Lucene 会在其中查找书中的一个单词,然后显示使用这些单词的句子. 我一直在阅读 Lucene in Action 这本书,其中提到了类似的内容,但通过它我找不到其他提及.这是你可以用 Lucene 做的事情吗?如果是,你是怎么做到的? 解决方案 我相信您正在寻找 ..
发布时间:2022-01-15 13:05:07 Java开发

没有数据库的休眠搜索

是否可以只对它的注释使用休眠搜索(bean => 文档/文档 => bean 映射),而根本不使用数据库?如果是这样,是否有任何在线示例基本上显示了如何设置? 我发现以下内容:http://mojodna.net/2006/10/02/searchable-annotation-driven-indexing-and-searching-with-lucene.html,但如果它支持我的使用 ..
发布时间:2022-01-15 13:05:01 Java开发

为什么 Query、TermQuery 等不再在 Lucene 4.0 中实现 Serializable?

我需要使用 EJB 通过网络发送一个包含诸如 Query 之类的 Lucene 元素的类,当然这个类需要被序列化.我将我的课程标记为 Serializable 但似乎还不够: org.apache.lucene.search.TermQuery 不可序列化 确实,当我阅读 Lucene (4.0) 的最后一个稳定版本的 javadoc 时,我可以看到 TermQuery 没有实现 Serial ..
发布时间:2022-01-15 13:04:29 Java开发

在 Lucene 中获取每个文档的搜索词 Hits(出现次数)

任何人都可以建议我在 Lucene 中获取每个文档的 Hits(没有出现次数)的最佳方法吗?.. 解决方案 Lucene 使用基于字段而不是基于文档的索引.为了获得每个文档的术语计数: 使用 IndexReader.document() 和 isDeleted(). 在文档 d 中,使用 Document.getFields(). 对于每个字段 f,使用 getTermFreqV ..
发布时间:2022-01-15 13:04:14 其他开发

在 Lucene.net 2.9.2 中突出显示整个句子

目前我正在使用 Lucene.net 2.9.2 框架.作为我的搜索结果,我想获得带有突出显示的文本片段的结果页面(asp.net).我希望所选片段是一个整个句子,而不仅仅是几个单词. 例如,如果我有文字: Lorem ipsum dolor sit amet,consectetur adipisicing elit,sed do eiusmod tempor incididunt u ..
发布时间:2022-01-15 13:04:04 C#/.NET

确定哪个值在 SOLR 多值字段类型中产生了命中

如果我有一个多值字段类型的文本,我将值 [cat,dog,green,blue] 放入其中.有没有办法告诉我什么时候针对 dog 的该字段执行查询,它位于那个 multiValued 字段的第一个元素位置? 假设:客户端不知道被查询的字段的字段类型是什么.(即 Solr 必须提供答案,并且客户端无法对返回文档进行后处理以找出答案,因为它不知道 SOLR 如何将查询与结果匹配). 披露: ..
发布时间:2022-01-15 13:03:51 其他开发

Jackrabbit 针对 UUID 运行查询

我正在使用 Jackrabbit,我正在尝试查询具有 UUID 的现有节点.我的代码如下所示.问题是 referenceNode 的 UUID 的格式为“'90be246a-a17c-445e-a5ad-81b064de0bee'",而且 Jackrabbit (Lucene) 中使用的 XPATH 引擎似乎在处理连字符时存在问题. 如果我运行 query2,一切都很好,并且会打印 refe ..
发布时间:2022-01-15 13:03:35 其他开发

Lucene 与 EclipseLink 的集成

我正在尝试将 Lucene 与 EclipseLink 一起使用,并且想知道是否有任何好的集成库?我见过太阳耀斑,它看起来很石灰,它可能会做我想做的事,但它已经过时了(虽然我有旧版本的 EclipseLink,我使用的是 Lucene 的 4.10)这可能有效,但我找不到任何文档,如何使用它的示例或教程. 任何建议都将不胜感激(我不相信我们也可以切换到 Hibernate) 提前致谢 ..
发布时间:2022-01-15 13:03:26 Java开发

如何提高单字符 PrefixQuery 的性能?

我有一个包含 150 万个文档的 RAMDirectory,我正在使用 PrefixQuery 搜索单个字段.当搜索文本长度为 3 个或更多字符时,搜索速度极快,不到 20 毫秒.但是当搜索文本的长度少于 3 个字符时,搜索可能需要整整 1 秒. 由于它是一项自动完成功能,并且用户从一个字符开始(并且确实有 1 个字符长度的结果),因此我无法限制搜索文本的长度. 代码差不多: var ..
发布时间:2022-01-15 13:03:18 其他开发