lucene.net相关内容

当我不知道创建时的最大大小时,如何使用 Lucene 的 PriorityQueue?

我为 Lucene.Net 构建了一个自定义收集器,但我不知道如何对结果进行排序(或分页).每次调用 Collect 时,我都可以将结果添加到内部 PriorityQueue 中,我知道这是正确的方法. 我扩展了 PriorityQueue,但它在创建时需要一个大小参数.您必须在构造函数中调用 Initialize 并传入最大大小. 但是,在收集器中,搜索器只是在获得新结果时调用 Co ..
发布时间:2022-01-15 13:23:11 其他开发

lucene.net 结合了多个过滤器并且没有搜索词

如何在 Lucene.Net 中跨多个字段进行过滤?在一个领域我只是这样做: TermQuery tool = new TermQuery(new Term("Tool", "Nail"));过滤器 f = new QueryFilter(tool); 如果我现在想为过滤器添加指甲长度,我该怎么做? 另外,我希望用户能够在没有搜索词的情况下进行搜索(即只需选择一个类别),我该怎么做? ..
发布时间:2022-01-15 13:22:32 其他开发

使用 .net Web 应用程序实现 Solr

我即将实施 Solr 以在基于 NopCommerce 的购物车应用程序上进行搜索.我想对步骤有一个想法,我应该如何进行.我已经在谷歌上寻求一些帮助,但它并没有真正帮助.我发现 .net 有一个接口可以将它与 .net 应用程序集成,但在 solr 网站上没有找到任何文档或教程. 我需要您的帮助来决定解决这个问题的最佳方法. 解决方案 有一个SolrSolr 网站上的教程.至于设置可 ..
发布时间:2022-01-15 13:20:20 其他开发

在 Lucene 中正确索引纬度和经度值

我正在使用 Lucene API 开发“在给定半径内基于​​美国的最近城市搜索"功能.我在 Lucene 中索引城市的纬度和经度值如下: doc.Add(new Field("latitude", paddedLatitude, Field.Store.YES, Field.Index.UN_TOKENIZED));doc.Add(new Field("longitude", paddedLon ..
发布时间:2022-01-15 13:19:31 其他开发

Lucene IndexWriter 添加文档速度慢

我编写了一个小循环,将 10,000 个文档添加到 IndexWriter 中,并且花了很长时间才完成. 还有其他方法可以索引大量文档吗? 我问是因为当它上线时,它必须加载 15,000 条记录. 另一个问题是如何避免在重新启动 Web 应用程序时再次加载所有记录? 编辑 这是我使用的代码; for (int t = 0; t ..
发布时间:2022-01-15 13:18:38 C#/.NET

使用 Lucene 搜索 API 查找完全匹配

我正在使用 Lucene 开发公司搜索 API.我的 Lucene 公司索引有 2 家公司:1.Abigail Adams National Bancorp, Inc.2.国民银行 如果用户键入 National Bancorp,则只应返回公司#2(即 National Bancorp)而不是#1.....即.只应返回完全匹配.如何实现此功能? 感谢阅读. 解决方案 可以使用K ..
发布时间:2022-01-15 13:18:31 其他开发

需要知道使用 RAMDirectory 的利弊

我需要提高 Lucene 搜索查询的性能.我可以使用 RAMDirectory 吗?它会优化性能吗?是否有任何索引大小限制?如果有人能列出使用 RAMDirectory 的优缺点,我将不胜感激. 谢谢. 解决方案 我比较FSDirectory和RAMDirectory. 索引大小为 1.4G Centos,5G 内存 搜索1000个关键词,平均/最小/最大响应时间(ms ..
发布时间:2022-01-15 13:17:16 其他开发

每个领域的不同分析仪

如何为使用 Lucene 编制索引的文档中的每个字段启用不同的分析器?示例: RAMDirectory dir = new RAMDirectory();IndexWriter iw = new IndexWriter(dir, new StandardAnalyzer(Lucene.Net.Util.Version.LUCENE_CURRENT), true, IndexWriter.Max ..
发布时间:2022-01-15 13:13:44 其他开发

避免在重建期间删除当前的 Lucene.NET 索引

我是 Lucene.NET 的新手,但我正在使用 一个开源工具Sitecore CMS,它使用 Lucene.NET 来索引 CMS 中的大量内容.我昨天确认,当我重建索引时,当前的索引文件会擦除干净,因此任何依赖索引的东西在大约 30-60 秒(完整索引重建的时间量)内没有数据.是否有最佳实践或方法使 Lucene.NET 在完全重建新索引之前不会覆盖当前索引文件?我基本上认为我希望它写入新的临 ..
发布时间:2022-01-15 13:12:58 C#/.NET

Lucene 标准分析器与 Snowball

刚刚开始使用 Lucene.Net.我使用标准分析器索引了 100,000 行,运行了一些测试查询,并注意到如果原始术语是单数,复数查询不会返回结果.我了解雪球分析器添加了词干支持,这听起来不错.但是,我想知道使用雪球超过标准的锣是否有任何缺点?跟着它走,我会失去什么吗?是否还有其他分析仪可供考虑? 解决方案 是的,通过使用 Snowball 等词干分析器,您会丢失有关文本原始形式的信息. ..
发布时间:2022-01-15 13:11:32 其他开发

Lucene.Net 最佳实践

使用 Lucene.Net 的最佳实践是什么?或者我在哪里可以找到一个好的 lucene.net 使用示例? 解决方案 如果你打算使用 Lucene,我会买一本从头到尾的好书.Lucene 的学习曲线非常陡峭(在我看来).重要的不仅仅是知道如何搜索您的 - 它还涉及索引它.进行基本搜索很容易,但是创建一个包含数百万条数据记录的索引并且仍然能够对其进行闪电般的快速搜索是可能的,但非常困难.没 ..
发布时间:2022-01-15 13:08:43 C#/.NET

使用 Lucene.Net 有哪些好的资源?

有谁知道我在哪里可以找到有关 Lucene.Net 的更多信息? 我正在寻找有关如何使用 Lucene.Net 的教程或视频,堆栈溢出用户可以亲自推荐. 解决方案 CodeProject上有一些很棒的文章: http://www.codeproject.com/KB/library/IntroducingLucene.aspx http://www.codeproject.c ..
发布时间:2022-01-15 13:08:30 C#/.NET

使用 BooleanQuery 还是编写更多索引?

这样的类别树: root_1sub_1sub_2... 到 sub_20 每个文档都有一个子类别(如 sub_2).现在,我只在lucene索引中写了sub_2: new NumericField("category",...).setIntValue(sub_2.getID()); 我想获取所有 root_1 的文档,使用 BooleanQuery(将 sub_1 合并到 sub_20) ..
发布时间:2022-01-15 13:07:39 Java开发

MultiFieldQueryParser 正在从首字母缩写词中删除点

由于我的问题没有得到回答,所以我再次发布这个问题. 我正在使用 Lucene 开发图书搜索 API.用户可以搜索标题或描述字段包含 C.F.A 的书...我正在使用 StandardAnalyzer 以及停用词列表. 我使用 MultiFieldQueryParser 来解析上面的字符串.但是解析后,它会删除字符串中的点.我在这里错过了什么? 谢谢. 解决方案 正如你所说 ..
发布时间:2022-01-15 13:07:29 其他开发

Lucene.Net 模糊搜索速度

很抱歉,希望能得到有Lucene经验的人的帮助. 现在我们在应用程序中使用 Lucene.Net 3.0.3 来索引和搜索约 2.500.000 个项目.每个实体包含27个可搜索字段,以这种方式添加到索引中:new Field(key, value, Field.Store.YES, Field.Index.ANALYZED)) 现在我们有两个搜索选项: 使用模糊搜索仅搜索 4 ..
发布时间:2022-01-15 13:06:18 C#/.NET

在 Lucene.net 2.9.2 中突出显示整个句子

目前我正在使用 Lucene.net 2.9.2 框架.作为我的搜索结果,我想获得带有突出显示的文本片段的结果页面(asp.net).我希望所选片段是一个整个句子,而不仅仅是几个单词. 例如,如果我有文字: Lorem ipsum dolor sit amet,consectetur adipisicing elit,sed do eiusmod tempor incididunt u ..
发布时间:2022-01-15 13:04:04 C#/.NET

如何提高单字符 PrefixQuery 的性能?

我有一个包含 150 万个文档的 RAMDirectory,我正在使用 PrefixQuery 搜索单个字段.当搜索文本长度为 3 个或更多字符时,搜索速度极快,不到 20 毫秒.但是当搜索文本的长度少于 3 个字符时,搜索可能需要整整 1 秒. 由于它是一项自动完成功能,并且用户从一个字符开始(并且确实有 1 个字符长度的结果),因此我无法限制搜索文本的长度. 代码差不多: var ..
发布时间:2022-01-15 13:03:18 其他开发

具有频繁更新索引的 FieldCache

你好 我有经常使用新记录更新的 lucene 索引,我的索引中有 5,000,000 条记录,并且我正在使用 FieldCache 缓存我的数字字段之一.但是在更新索引后,再次重新加载 FieldCache 需要时间(我正在重新加载缓存,因为文档说 DocID 不可靠)所以我怎样才能通过仅将新添加的 DocID 添加到 FieldCache 来最小化这种开销,导致此功能成为我的瓶颈应用. In ..
发布时间:2022-01-15 13:03:00 Java开发

在 SQL 数据库中进行手动更改时,Lucene.Net 索引更新

我是 Lucene.Net 的新手,目前正在进行研发以将其用于 .Net 应用程序.由于 Lucene.Net 是一个通用库,它与 SQL Server、SQLite 等数据源无关.它只知道你有一个你想要索引的 Lucene 文档.因此,当我们将数据从任何数据源转储到 Lucene.Net 时.当数据在 SQL 数据库中时,我们如何使 Lucene.Net 文档保持最新(例如).保持两种数据(即( ..
发布时间:2022-01-15 13:02:53 C#/.NET