solrj相关内容
我使用的是 solr 4.10.3,我通过 Java 中的嵌入式码头服务器启动 solr.我正在尝试使用 2 个分片(Leaders)配置 solrcloud.我有一个外部zookeeper设置,我在像这样启动solr时指向zookeeper实例. System.setProperty("zkHost", "192.168.2.21:2111");System.setProperty("num
..
如何维护 HTML 文档的原始格式Solr 给出的结果? 我正在尝试在我公司的一个网站中提供搜索功能,该网站拥有数百万个文档,并且所有文档的格式都不相似,因此很难单独设置每个文档的格式. 我在 apache 站点使用 Solr 4.1 nightly builds,该站点内置了对 solr 的支持-细胞和蒂卡.即我不需要单独配置它们. solr-cell 或 tika 是否在任何
..
我的(网络)应用程序中有以下工作流程: 从存档下载 pdf 文件 索引文件 删除文件 我的问题是在索引文件后,它保持锁定状态并且删除部分抛出异常. 这是我用于索引文件的代码片段: 试试{ContentStreamUpdateRequest req = new ContentStreamUpdateRequest("/update/extract");req.addFile(
..
谁能给我指点教程. 我使用 Solr 的主要经验是索引 CSV 文件.但是我找不到任何简单的说明/教程来告诉我索引 pdf 需要做什么. 我见过这个:http://wiki.apache.org/solr/ExtractingRequestHandler 但这对我来说意义不大.我需要安装 Tika 吗? 我迷路了 - 请帮忙 解决方案 其中最难的部分是使用 Aper
..
我的项目中有这个问题.我使用 Apache Poi 读取了我的 .xlsx excel 文件,我想在我的 Solr 核心中索引它们.我使用 SolrInputDocument 来索引读取文件.这是我的java代码 package org.solr;导入 org.apache.poi.ss.usermodel.*;导入 org.apache.poi.xssf.usermodel.XSSFWorkb
..
我正在尝试使用我的 android 应用程序中的 Solrj 索引文档,但它似乎不起作用. 我关注这个LINK 这是我正在编写的代码: package com.example.secondapp;导入 android.app.Activity;导入 android.content.ActivityNotFoundException;导入 android.content.Intent;
..
我正在为我的 solr-indexer 应用程序编写一些测试代码.遵循测试最佳实践,我想编写独立的代码,只需加载 schema.xml 和 solrconfig.xml 并为索引搜索测试创建临时数据树.由于应用程序大部分是用 Java 编写的,我正在处理 SolrJ 库,但我遇到了问题(好吧,我迷失在 corecontainers-coredescriptor-coreconfig-solrcor
..
如何使用 Solrj 处理 Solr 中的事务管理?网络上没有太多与此相关的文档.但如果有人可以提供与使用 SolrJ 进行事务管理相关的任何链接或信息,我将不胜感激. 解决方案 您必须以编程方式处理 SolrJ 中的事务.处理多个写入时. 使用 SolrServer api add 方法将 SolrInputDoucments 添加到服务器. 添加所有 SolrInputDocu
..
我正在尝试使用 solrj 创建新核心.我需要它来为我的应用程序准备测试.我认为这段代码不完整或错误,因为每次我收到错误“没有核心候选人". package com.itsystems.talentapp.config;导入 org.apache.solr.client.solrj.SolrClient;导入 org.apache.solr.client.solrj.SolrServerExce
..
在创建集合时使用以下查询,我为 collection10 设置了两个分片. /solr/admin/collections?action=CREATE&name=collection10&numShards=2&replicationFactor=2 但是我的要求是,在前两个分片中索引了 10000 个文档后,我必须动态添加第三个分片. 一旦我们在现有分片上开始收集和索引,是否可
..
我需要向在 tomcat 上运行的 Java web 应用程序添加搜索功能,以及在同一台机器上的数据库. 因为我打算在同一台机器上使用 Solr,但应该使用哪个实现?我认为嵌入式更可取,因为我需要从同一台机器添加数据,所以通过 HTTP 添加没有多大意义,不是吗?&此外,将 Solr 作为单独的 Web 应用程序运行会比嵌入式应用程序消耗更多资源(不是吗?). 但是既然不推荐使用Emb
..
众所周知,conf目录中有一个synonym.txt文件,每当我发现一些新的同义词时,我都想更新它... 那么有没有办法在不重启Solr 服务器的情况下动态更新该文件,我的搜索结果会考虑新的同义词吗?? 如果有人有任何想法,请帮助我..提前致谢... 解决方案 我认为你可以建立自己的 SynonymFilterFactory 扩展原始并使用您的自定义 FSTSynonymF
..
在从 master 到 slave 的复制过程中,我们不断收到此异常.我们的索引大小是 9.7 G,我们正在尝试从头开始复制一个从站. 2013 年 10 月 30 日 18:22:16,996 [explicit-fetchindex-cmd] 错误 ReplicationHandler - SnapPull 失败:org.apache.solr.common.SolrException:
..
我的 SolrCloud 有 3 个分片. 我的目的:从类别中选择并处理所有产品. 当前实施:循环中的部分选择. 第一次迭代:q=cat:1&start=0&rows=100 第二次迭代:q=cat:1&start=100&rows=100 第三:q=cat:1&start=200&rows=100 ... 但是“开始"增长,性能下降.此处说明:https://w
..
我一直在尝试学习 solr 来实现对应用程序之一的搜索.我总是碰到三个不同的库,solr-core、solrj 和 spring-data-solr 三个之间的基本区别是什么三个罐子,哪个应该与弹簧一起使用?最近我尝试在 spring 中使用 solrj 和 solr-core 并得到一个 StackOverflowException 这里是我的问题导致堆栈溢出.无法找到解决方案,我尝试删除
..
我有一个Solr架构,其中包含不同类型的动态字段.例如,schema.xml中有:
..
我有一个特定的要求,我只想在节点故障后群集启动重新启动过程时,仅使用solr自动缩放功能创建拉式副本.但是,当节点关闭并启动时,使用solrcloud自动缩放会创建NRT类型副本.我已经浏览了策略规范列表中给出的示例: https://lucene.apache.org/solr/guide/7_4/solrcloud-autoscaling-policy-preferences.html#pol
..
solr/zookeeper面临的问题是zookeeper在10000ms后超时.错误如下. SolrException:java.util.concurrent.TimeoutException:在10000毫秒内无法连接到ZooKeeper:9181,:9182,:9183.在org.apache.solr.common.clou
..
我有一个SolrCloud(v5.2)设置,带有2个不同的内核[ users,docs ]正常工作. 现在,我需要能够动态添加新的核心,这些新的核心在配置方面与已经存在的 docs 核心相同.我不想重复配置(我尝试过可以正常运行),因为我实际上需要共享 synonyms.txt 和一些其他不断变化的文件. 我认为我需要"configsets",但是我无法使它们正常工作.我使用以下命令上
..
首先,我创建一个名为 usercollection 的集合: http://xxxxx/solr/admin/collections?action = CREATE& name = usercollection& numShards = 3& replicationFactor = 3& maxShardsPerNode = 3 然后我发现了问题,因此将其删除. http://xxxx
..