lucene相关内容

Lucene.NET - 按 int 排序

在最新版本的 Lucene(或 Lucene.NET)中,以排序顺序返回搜索结果的正确方法是什么? 我有这样的文件: var document = new Lucene.Document();document.AddField("Text", "foobar");document.AddField("CreationDate", DateTime.Now.Ticks.ToString()) ..
发布时间:2022-01-15 12:45:26 其他开发

是否应该在 Lucene 中的增量索引之后优化索引?

我们每 7 天对 Lucene 索引运行一次完整的重新索引(即从头开始创建索引),每 2 小时左右运行一次增量索引.我们的索引包含大约 700,000 个文档,完整索引大约需要 17 个小时(这不是问题). 当我们做增量索引时,我们只索引在过去两个小时内发生变化的内容,因此花费的时间要少得多——大约半小时.但是,我们注意到其中大部分时间(可能 10 分钟)都花在了运行 IndexWriter ..
发布时间:2022-01-15 12:45:14 其他开发

查找 Lucene 索引的术语列表

是否可以将 Lucene 索引中的所有术语列表提取为字符串列表?我在文档中找不到该功能.谢谢! 解决方案 Lucene 3: C#:C# Lucene 获取所有索引 Java: IndexReader indexReader = IndexReader.open(path);TermEnum termEnum = indexReader.terms();而(termEnum. ..
发布时间:2022-01-15 12:44:41 其他开发

如何使用 TermVector Lucene 4.0

在索引方法中,我使用以下行: Field contentsField = new Field("contents", new FileReader(f), Field.TermVector.YES); 但是,在 Lucene 4.0 中,此构造函数已被弃用,应使用 new TextField 代替 new Field. 但 TextField 的问题在于它的构造函数中不接受 TermVe ..
发布时间:2022-01-15 12:44:34 Java开发

如何在elasticsearch中对结果进行分组?

我将书名存储在 elasticsearch 中,它们都属于许多商店.像这样: {“书":[{“身份证":1,"title": "标题 1",“商店":“商店 1"},{“身份证":2,"title": "标题 1",“商店":“商店 2"},{“身份证":3,"title": "标题 1",“商店":“商店3"},{“身份证":4,"title": "标题 2",“商店":“商店 2"},{“身 ..
发布时间:2022-01-15 12:44:24 其他开发

如何标准化 Lucene 分数?

我需要将 Lucene 分数标准化为 0 到 1 之间. 例如,随机查询返回以下分数... 8.8646652.7926872.7926872.7926872.7926870.490090370.337302420.337302420.337302420.33730242 最大的分数是多少?10.0 ? 谢谢 解决方案 你可以将所有分数除以最大分数,得到0到1之间的分数. ..
发布时间:2022-01-15 12:43:44 其他开发

Lucene Proximity 搜索超过两个词的短语

Lucene 的手册中已经清楚地解释了邻近搜索的含义,其中包含两个单词,例如 "jakarta apache"~10 中的示例http://lucene.apache.org/core/2_9_4/queryparsersyntax.html#Proximity Searches 但是,我想知道像 "jakarta apache lucene"~10 这样的搜索到底是做什么的?它是否允许相邻 ..
发布时间:2022-01-15 12:43:28 Java开发

如何在 Lucene 3.0.2 中索引和搜索文本文件?

我是 Lucene 的新手,在创建查询文本文件集合的简单代码时遇到了一些问题. 我试过 这个例子,但是和新版本的Lucene不兼容. UDPATE: 这是我的新代码,但还是不行还没有. 解决方案 Lucene 是一个相当大的话题,涉及到很多类和方法,如果不了解一些基本概念,通常是无法使用它的.如果您需要快速可用的服务,请改用 Solr.如果您需要完全控制 Lucene,请继续阅 ..
发布时间:2022-01-15 12:43:18 Java开发

分页 Lucene 的搜索结果

我正在使用 Lucene 在 Web 应用程序中显示搜索结果.我也在自定义分页以显示相同的结果.搜索结果可能从 5000 到 10000 或更多.有人可以告诉我分页和缓存搜索结果的最佳策略吗? 解决方案 我建议你不要缓存结果,至少不要在应用程序级别.不过,在具有大量内存(操作系统可用于其文件缓存)的机器上运行 Lucene 会有所帮助. 只需为每个页面使用不同的偏移量重复搜索即可.缓 ..
发布时间:2022-01-15 12:43:05 其他开发

使用 Lucene 统计分类结果

我正在尝试使用 Lucene Java 2.3.2 来实现对产品目录的搜索.除了产品的常规字段外,还有一个名为“类别"的字段.一个产品可以属于多个类别.目前,我使用 FilteredQuery 在每个类别中搜索相同的搜索词,以获取每个类别的结果数. 这会导致每个查询进行 20-30 次内部搜索调用以显示结果.这大大减慢了搜索速度.有没有更快的方法使用 Lucene 实现相同的结果? 解 ..
发布时间:2022-01-15 12:42:49 Java开发

多字段,多词,不匹配query_string

我希望能够将多词搜索与多个字段进行匹配,其中搜索的每个词都包含在 any 字段的任意组合中.问题是我想避免使用 query_string. curl -X POST "http://localhost:9200/index/document/1" -d '{"id":1,"firstname":"john","middlename":"clark"“姓氏":“史密斯"}'curl -X POST ..
发布时间:2022-01-15 12:42:41 其他开发

你如何在 .net 上运行 Lucene?

Lucene 是一个优秀的搜索引擎,但是 .NET 版本落后于 Java 官方版本(.NET 最新稳定版本是 2.0,而 Java Lucene 最新版本是 2.4,它有更多功能). 你如何解决这个问题? 解决方案 我发现了一种让我感到惊讶的方法:从 Java .jar 文件创建一个 .NET DLL!使用 IKVM 你可以 下载Lucene,获取.jar文件,运行: ikvmc ..
发布时间:2022-01-15 12:42:25 Java开发

在 ASP.NET MVC 站点中正确构建 Lucene.Net 使用

我正在构建一个 ASP.NET MVC 站点,我计划在其中使用 Lucene.Net.我已经设想了一种构建 Lucene 使用的方法,但不确定我计划的架构是否可行且高效. 我的计划: 关于 Global.asax 中的 Application_Start 事件:我检查文件系统上是否存在索引 - 如果不存在,我创建它并用从数据库. 提交新内容时:我创建一个IndexWriter,填写一 ..
发布时间:2022-01-15 12:41:50 C#/.NET

SQL Server 2008 全文搜索 (FTS) 与 Lucene.NET

我知道过去有关于 SQL 2005 与 Lucene.NET 的问题,但自 2008 年问世以来,他们对其进行了很多更改,并想知道是否有人可以给我优点/缺点(或链接到文章). 解决方案 我于 2006 年在 SQL Server 2005 的 FTS 之上构建了一个中等大小的知识库(可能是 2GB 的索引文本),现在已将其移至 2008 的 iFTS.这两种情况对我来说都很好,但从 200 ..

Node.js 有没有好的索引/搜索引擎?

我正在为 node.js 应用程序寻找一个好的开源(使用 LGPL 或许可许可证)索引引擎,比如 Lucene.我正在寻找进程内索引和搜索,但对像 Sphinx 或 Solr 这样的索引服务器不感兴趣. 我也不害怕为 C/C++ 库创建绑定,所以我也愿意接受这些建议. 到目前为止我已经找到了 node-clucene 似乎不再积极维护(并且有几个未解决的问题) 我可以为 CLu ..
发布时间:2022-01-15 12:41:25 前端开发

Lucene 是如何工作的

我想知道 lucene 搜索是如何运行得如此之快的.我在网上找不到任何有用的文档.如果您有任何东西(缺少 lucene 源代码)要阅读,请告诉我. 在我的例子中,使用带有索引的 mysql5 文本搜索的文本搜索查询大约需要 18 分钟.对同一查询的 lucene 搜索不到一秒钟. 解决方案 Lucene 是一个倒排全文索引.这意味着它获取所有文档,将它们拆分为单词,然后为每个单词构建 ..
发布时间:2022-01-15 12:41:14 其他开发