lucene相关内容
我正在尝试使用ApacheSolr正确地突出显示。在部分匹配的情况下,我想突出显示单词的匹配部分。但是,整个单词(部分匹配搜索词)会被高亮显示。 示例: 搜索“Adida Shih”,应该会出现两个项目,一个名称为“ADIDAS衬衫”,另一个名称为“ADIDAS红衫” /select?q=name:adida+shi&hl=true&hl.fl=name&qt=standardw
..
我正在查询 SolR 服务器以获取 价格 范围. 如何构造一个立即返回的查询: 所有商品的价格范围(无方面查询) 具有方面查询的商品的价格范围(或列表) 对于这样的滑块,我需要这四个值: all_min=============user_min========user_max========all_max 解决方案 使用StatsComponent获取最小值和最大值使用
..
我已经设置了 apache solr 7.1 并使用邮递员工具来查询它.但是当我尝试使用邮递员删除索引数据时,出现以下错误. 请求: GET http://localhost:8983/solr/solr-sample3/update?stream.body={“删除": {“询问": "*:*"},“犯罪": { }} 主体: {“错误": {“元数据":[“错误等级","org.a
..
我的应用程序中有经过身份验证的用户可以访问包含多达 500,000 个项目的共享数据库.每个用户都有自己的面向公众的网站,并且需要能够优先考虑在他们自己的网站上展示的项目(想想赞成). 在 500,000 个项目中,他们最多可能只有 200 个优先项目,其余项目的顺序不太重要. 每个用户对项目的优先级不同. 我最初在这里问了一个类似的 mysql 问题 Mysql 结果按每个用户
..
我正在使用 Lucene 3.5.0 在我的网站上做一些基本的搜索工作.我想将索引存储在 Mysql 数据库的 JDBC 目录中.我打算使用 Compass 项目来执行此操作,但经过更多研究并实际尝试了代码,我发现 Compass 是一个死项目,它不再与当前版本的 Lucene 兼容. 还有其他选项可以将我的索引存储在 JDBC 目录中吗?Lucene 不提供这个原生是有原因的吗?出于某种原
..
我很茫然.我一直试图让这个工作好几天了.但是我对此无能为力,所以我想我会在这里咨询你们,看看是否有人能够帮助我! 我正在使用 pyparsing 尝试将一种查询格式解析为另一种格式.这不是一个简单的转变,但实际上需要一些脑筋:) 当前查询如下: ("breast neoplasms"[MeSH 术语] OR 乳腺癌[致谢]OR 乳腺癌[图/表格说明] OR 乳腺癌[章节标题]OR 乳
..
我在 Mac OSX 上安装 PyLucene JCC 时遇到问题. 我从 apache lucene 站点下载了最新版本的 JCC,并按照说明使用命令安装它 python setup.py build 但我在安装时遇到以下错误 ld:内部错误:在 x86_64 架构的 symbolIndex(__ZN7JNIEnv_13CallIntMethodEP8_jobjectP10_jmet
..
我的要求是针对用户请求提升有限数量(例如五个)文档. 我得到的是一个单独的文档字段,它存储了一个类似于表示电梯排名值的提升值的数值. 因此,用户查询将返回电梯排名值最高的 5 个文档,其余文档按常规顺序填充页面. 怎么做? QueryElevationComponent 只允许static 查询定义.提升不允许提升特殊电梯排名字段的有限数量文档. 我必须编写修改后的
..
按照安装说明,JCC搭建成功. 安装的依赖项是:蚂蚁,openjdk-7-jdk,python-setuptools,python-dev. 然后开始制作pylucene,在“Makefile"中选择与Ubuntu 11相对应的规格. # Linux (Ubuntu 11.10 64-bit, Python 2.7.2, OpenJDK 1.7, setuptools 0.6.16)
..
目前我喜欢这样: IndexSearcher searcher = new IndexSearcher(lucenePath);点击 hits = searcher.Search(query);文件文件;列表companyNames = 新列表();for (int i = 0; i ().Skip(offSet ?? 0).ToList();return companyNa
..
在 Solr 中,您可以使用语法执行有序邻近搜索 "word1 word2"~10 按顺序,我的意思是 word1 在文档中总是排在 word2 之前.我想知道是否有一种简单的方法来执行无序的邻近搜索,即.word1 和 word2 出现在 10 个单词之内,无论哪个先出现. 一种方法是: "word1 word2"~10 OR "word2 word1"~10 上述方法可行,但如果
..
瞄准 将我的弹性搜索服务器与我的 SQL 数据库中的新数据和过期数据同步 问题 我可以通过两种截然不同的方式实现这一目标,但我不知道哪种方式更好.我可以通过使用 JDBC River 插件直接连接到 SQL 数据库拉信息到 elasticsearch.或者,我可以使用 PHP 客户端将数据推送到 elasticsearch,使用下面显示的代码作为示例: //文档的Id$id =
..
我正在体验使用 .NET NEST 客户端和 ElasticSearch 的批量索引性能会随着时间的推移而降低,索引数量和文档数量都是恒定的. 我们正在使用 Ubuntu Server 12.04.1 LTS 64 位和 Sun Java 7 的 m1.large Amazon 实例上运行 ElasticSearch 版本:0.19.11,JVM:23.5-b02.没有别的了在这个实例上运行
..
我正在尝试以嵌套方式按多个字段执行搜索结果聚合(计数和总和)分组. 例如,使用本文末尾显示的架构,我希望能够获得按“类别"分组并按“子类别"进一步分组的“大小"总和,并得到类似这个: …… 我主要关注 Solr 的 Stats 组件
..
尝试使用 Lucene 4.0 计算词频.我的文档频率工作得很好,但不知道如何使用 API 来做词频.这是我的代码: private static void addDoc(IndexWriter writer, String content) throws IOException {FieldType fieldType = new FieldType();fieldType.setStoreT
..
有人可以帮我推荐一个支持 Python 的全文搜索引擎吗? 现在我们有一个 MySQL 数据库,我想添加一个功能,让全文搜索引擎索引该数据库中某些表中的某些文本.Web 应用程序将使用此文本数据来搜索数据库中的相应记录.例如,在我们的客户表中索引客户名称信息,使用 Web 应用程序进行全文搜索以获取客户的 MySQL 记录. 我(简要地)看过 Lucene、Swish-E 和 Mong
..
我在 Lucene 中添加了一个多值字段: String categoriesForItem = getCategories();//从 DB 调用返回“category1, category2, cat3"字符串 [] categoriesForItems = categoriesForItem.split(",";for(字符串猫:categoriesForItems){doc.add(ne
..
在我们的 sitecore 项目(6.6.0 rev. 130404)中,我们有超过 200 万个 sitecore 项目.我们配置了几个 Lucene 索引(每个索引都是这些项目的一个子集).我们面临的问题是重新重建这些索引所需的时间.特别是使用 Sitecore 的快速搜索索引,除了我们的自定义索引之外,重建该索引可能需要将近一整天的时间. 在日常运营中维护大型站点核心索引的通常做法是什
..
我想在索引上使用 Lucene 进行搜索.索引经常更改.所以我需要做一些事情来同时搜索和索引.它是 Tomcat 上的 Web 应用程序.我想使用 RAMDeirectory 来提高搜索速度.我不知道该怎么做! 解决方案 misc Lucene 包中的NRTManager 提供同时搜索和索引的能力. TrackingIndexWriter 编写器;//你的作家SearcherFactor
..
..