solr4相关内容

通过PowerShell获取Solr内核

有没有办法使用PowerShell获取在我的Solr本地实例中运行的Solr核心列表?我正在运行Solr 4.10.1,并且正在使用PowerShell 2.0。 我想创建核心名称的文本文件: somecore1 somecore2 etc. 我通过点击以下URL:http://localhost:8983/solr/admin/cores能够获得XML格式的内核列表:返回的XML ..
发布时间:2022-07-13 13:00:11 其他开发

如何配置 Solr 以提高索引速度

我有一个客户端程序,它生成 1-50 百万个 Solr 文档并将它们添加到 Solr. 我正在使用 ConcurrentUpdateSolrServer 从客户端推送文档,每个请求 1000 个文档. 文档相对较小(很少有小文本字段). 我想提高索引速度. 我尝试将“ramBufferSizeMB"增加到 1G,将“mergeFactor"增加到 25,但没有看到任何变化. 我想知道是否 ..
发布时间:2021-12-30 08:59:13 其他开发

将令牌添加到 lucene 令牌流

我编写了一个 TokenFilter 来在流中添加标记. 1.测试表明它有效,但我不完全明白为什么. 如果有人能阐明语义,我将不胜感激.特别是在(*)处,恢复状态,是不是我们要么覆盖当前的token,要么覆盖捕获状态之前创建的token? 这大概就是我所做的 private final LinkedListextraTokens = new LinkedList();私有最终 ..
发布时间:2021-12-30 08:55:03 Java开发

如何索引存储在 solr4 中其他服务器上的 XML 文件

我已将所有 XML 文件存储在另一台服务器上,并且已在不同服务器上安装并配置了 SOLR.如何将这些 XML 文件索引到 SOLR 中.我已经检查过 nutch,但它的主要目的是抓取 html 页面并将它们编入索引.我不需要爬行.我在其他服务器上的特定路径上拥有所有这些文件.我只需要在 SOLR 中索引这些 XML 文件.我已经安装并配置了 SOLR4. 如果有人做过这样的事情,请告诉我该怎 ..
发布时间:2021-12-30 08:44:36 其他开发

如何根据动态字段对 solr 结果进行排序

我需要根据动态字段对结果进行排序.我怎样才能做到这一点?当我对其中一些动态属性的最小值进行排序时.它没有给出正确的结果,因为我的查询就像 &sort=min(A_160018,A_chandigarh1) 一些文档同时具有 A_160018 和 A_chandigarh1而有些文档没有字段,有些文档有 A_160018 或 A_chandigarh1 用于某些结果文档. 如何对此类动态字段进 ..
发布时间:2021-12-30 08:39:57 其他开发

solr - 将字段设置为默认搜索字段

以下查询对我来说效果很好 http://[]:8983/solr/vault/select?q=VersionComments%3AWhite 返回所有版本注释包含White的文档 我尝试省略字段名称并将其作为默认值,如下所示:在 solr 配置中我写 ..
发布时间:2021-12-30 08:39:50 其他开发

Solr 错误的拼写检查建议

使用 Solr 4.1 处理拼写建议. 我们正确配置了它,Solr 提供术语和整理建议.但是,我们注意到,如果我们再次搜索,建议的单词/collat​​e 很多时候都没有任何结果. 例如,我们搜索词“confort"但没有结果,有两个建议“comfort"和“convert".第一个术语包含结果.. 但是第二个术语没有带来任何结果,而是建议了另外两个术语,因此术语“转换"没有提供以下建 ..
发布时间:2021-12-30 08:22:35 其他开发

配置 Solr 以使用 UUID 作为键

我正在尝试配置 Solr 4 以使用 UUID,但到目前为止我没有成功 通过阅读文档,我看到了两种不同的方式来配置 schema.xml 以使用 UUID(两者都不起作用) 对于两者我都需要写 选项 1:添加: 并确保删除该行 id 选项 2添加: 两个选项都无法正常工作并返回org.apache.solr.common.SolrException:org.apa ..
发布时间:2021-12-30 08:19:59 其他开发

在 Solr 中使用函数查询来提高分数

我正在研究 Solr 4,以根据索引中存储的流行度排名优化我的 solr 结果排名. 现在当有人搜索时,除了相关度排名,我想使用流行度排名来影响相关度排名.最简单的公式可能是: 新的相关度排名 = 分数 * 人气排名 我一直在 http://wiki.apache.org/查看 Solr 函数查询solr/FunctionQuery#product 来实现相同的但是,我不知道如何 ..
发布时间:2021-12-30 08:18:35 其他开发

Solr 文本字段和字符串字段 - 不同的搜索行为

我正在开发 Solr 4+. 我的 solr 架构中有多个字段,具有不同的 solr 字段类型. 文本字段和字符串字段的搜索是否不同? 因为我试图搜索无法按预期工作的字符串字段(它是几个方面字段的副本字段).目标字符串字段被索引并存储. 但是,当我更改文本字段(仅索引)的目标字段时,它工作正常. 你能说明为什么会发生这种情况吗?solr 中文本字段和字符串字段在搜索方 ..
发布时间:2021-12-30 08:14:55 其他开发

SOLR 自动提交与自动软提交

我对 和 感到非常困惑.这是我的理解 autoSoftCommit - 在 autoSoftCommit 之后,如果 SOLR 服务器宕机,autoSoftCommit 文档将会丢失. autoCommit - 对磁盘进行硬提交,并确保所有 autoSoftCommit 提交都写入磁盘并提交任何其他文档. 我的以下配置似乎只适用于 autoSoftCommit.autoCommi ..
发布时间:2021-12-30 08:10:02 其他开发

Solr 索引与存储

我对 Solr 字段的索引和存储属性的行为有些困惑. 例如,如果我在 Schema.xml 中有以下内容 字段 test1 是否不会存储在 Solr 文档中,即使我创建了一个包含该字段的文档并为该字段设置了一个值并将文档提交给 Solr.由于我有 stored=false 属性,这是否意味着该字段的值在 Solr 中丢失并且没有持久化? 解决方案 这是正确的.通常,您希望您的字 ..
发布时间:2021-12-30 08:04:27 其他开发

重新加载 SolrCloud 配置(存储在 Zookeeper 上)-schema.xml

我已经使用独立的 zookeeper 设置了 SolrCloud 复制.但现在我希望对我的 Schema.xml 进行一些更改并重新加载核心.问题是,当我运行单个服务器 Solr(无 solrcloud)时,会加载新模式,但我不知道如何在所有复制服务器上重新加载模式.我尝试在其中一台服务器上重新加载架构,但没有预期的影响.有没有办法在使用zookeeper的分布式复制设置中在Solr中重新加载我的 ..
发布时间:2021-11-28 21:46:39 其他开发

在云模式下设置 Apache Solr

我必须做到以下几点: 我必须在 2 个服务器/节点上部署 Solr. 在另一台服务器上部署 Zookeeper. 上传自定义配置到 Zookeeper 创建一个包含 2 个分片和 2 个副本的自定义集合 Solr 7.4.0 & 版本动物园管理员: 3.4.12 我做了以下事情: 设置 Zookeeper: 创建了一个 Zookeeper 数据文件夹 &做了一个 ..
发布时间:2021-11-14 23:58:44 其他开发

重新加载 SolrCloud 配置(存储在 Zookeeper 上)- schema.xml

我已经使用独立的 zookeeper 设置了 SolrCloud 复制.但现在我希望对我的 Schema.xml 进行一些更改并重新加载核心.问题是,当我运行单个服务器 Solr(无 solrcloud)时,会加载新模式,但我不知道如何在所有复制服务器上重新加载模式.我尝试在其中一台服务器上重新加载架构,但没有预期的影响.有没有办法在使用zookeeper的分布式复制设置中在Solr中重新加载我的 ..
发布时间:2021-11-14 23:55:32 其他开发