lucene相关内容
的设置: 我有一个使用CouchDB的一个项目。该文件将有一个叫做“标签”字段中。这个“标签”字段是一个字符串数组(例如,“标签”:“TAG1”,“标签2”,“等”])。我使用CouchDB的 - lucene的作为我的搜索提供商。 问题: 什么功能可以被用来获取CouchDB的,Lucene来索引“标签”?元素 如果你有一个想法,但没有测试环境,键入出来,我来试试这里给出的结果。
..
我想更新我的code从Lucene的3.4至4.1。我想通了变化,除了之一。我有code这就需要遍历所有项的值一个字段。在Lucene的3.1有提供TermEnum,我可以遍历一个的IndexReader#条款()方法。这似乎已经改变了Lucene的4.1,甚至几个小时的文档中搜索我无法弄清楚如何了。可有人请点我朝着正确的方向? 感谢。 对于所有谁whant的直接回答。这是有关部分从迁移指南:
..
我有三个字段(用户ID,标题,描述)索引对象。我想找到一个特定用户的所有对象所在的标题或描述包含特定关键字。 我有这样的事情(但是这显然是错误的): WildcardQuery nameQuery =新WildcardQuery(新期限(“名”,filter.getSearch())); WildcardQuery descQuery =新WildcardQuery(新期限(“说明”,fil
..
我的一些同事们使用使用Lucene Java的内置搜索系统大的Java Web应用程序。我想要做的是有一个很好的基于HTTP的API来访问这些现有的搜索索引。我用的Nutch前,真的很喜欢的OpenSearch如何实施简单的做它来抓取结果RSS。 我试过设置Solr的DATADIR solrconfig.xml中,希望它会高兴地拿起现有的索引文件,但它似乎不理会他们。 我的主要问题是:
..
也许这个问题有点怪怪的......但我会尝试问问吧。 每个人,谁使用Lucene API写的应用程序,看到的是这样的: 公共静态字符串removeStopWordsAndGetNorm(文本字符串,字符串[]停用词,正规化正规化)抛出IOException异常 { 的TokenStream的TokenStream =新ClassicTokenizer(Version.LUCENE_44
..
我开发在Java中(使用Spring),它使用一个SQL Server数据库的Web应用程序。我使用Apache Lucene来实现我的web应用程序的搜索功能。与Apache Lucene的,以前我执行搜索创建标题的索引。我通过先获取数据库中的所有标题的列表做到这一点。然后,我遍历标题的列表,并添加他们中的每一个索引。这种情况发生在用户每次搜索的东西的时间。 我想知道是否有创建索引的更好的
..
我使用Solr的5.1。我想配置根据 Apache Solr实现维基在Solr搜索组件多个suggester定义 我已经完全配置单suggester和它的作品完美,但每当我试图配置多个suggester它给了我下面的错误 显示java.lang.NullPointerException 在org.apache.solr.handler.component.SearchHandler.h
..
谁能帮助我使用Solr的安装和配置它到mysql table.I已经试过几乎所有的教程,我试图与码头,也越来越tomcat.Still像数据处理程序的错误没有定义,或者无法找到solr.It已经有本周,我想了一整天 解决方案 为了让Solr的运行,(假设你已经下载Solr和它解压到某个位置),只需导航到码头文件夹中。 在应该有一个 start.jar 。 只需键入 Java的罐子s
..
我最近实施使用Apache Lucene的拼写检查。我的code提供如下: 公共无效loadDictionary(){ 尝试{ 文件DIR =新的文件(“C:/拼写检查/”); Directory目录= FSDirectory.open(DIR); 拼写检查=新的拼写检查(目录); 是什么意思=新PlainTextDicti
..
我有一个基于 A模块的Apache Lucene的 5.5 / 6.0这检索关键字。一切正常,除了一件事 - Lucene的不过滤停用词 我试图使停用词用两种不同的方法进行过滤。 的办法#1:的 的TokenStream =新的StopFilter(新ASCIIFoldingFilter(新ClassicFilter(新LowerCaseFilter(stdToken))),EnglishA
..
我卡在这一个问题。我想要做的是一个多值查询,看看如果一个值出现至少尝试。例如,字段必须是“免费”,“免费”,而不仅仅是“FREE”或“自由”,“IN_USE”。 字段 <字段名=“point_statusses”类型=“字符串”索引=“真正的”存储=“真正的”多值=“真”/>类型 <字段类型名称=“字符串”级=“solr.StrField”sortMissingLast =“真
..
我在生成使用Solr4的dataImportHandler一个UUID的问题。我试着从现有的MySQL数据库导入。 我的schema.xml中包含: <&领域GT; <字段名=的「uuid“TYPE =”的uuid“收录=”真正的“存储=”真“所需=”真“/> <字段名=“ID”类型=“字符串”索引=“真正的”存储=“真”所需=“真”/> &L
..
我有多个字段,其中之一是在其中我存储类别名称为的产品的字符串字段...如“电子产品”,“家”,“花园”等的索引 新StringField(“CATEGORY_NAME”,类别名称,Field.Store.YES)); //类别名称是如“电子”的值 我执行布尔查询来查找名称,价格和品类的产品,但我不知道该怎么办OR搜索,这样我可以在同一时间查询两大类。 我当前的查询是这样的:字符串猫=“电子”
..
我爬到一个网址,使用Nutch 2.1,然后我想他们得到了更新后重新抓取的网页。我怎样才能做到这一点?我怎么能知道一个网页被更新? 解决方案 只要你不能。您需要重新抓取网页,如果它的更新来控制。因此,根据您的需要,优先页/域和一段时间内重新抓取他们。为此你需要一个作业调度程序,如石英。 您需要编写一个比较页面的功能。然而,原本Nutch的保存页面作为索引文件。换句话说Nutch的产生新的
..
我下面 Apache Solr实现快速入门教程。本教程遇到索引丰富的文件的目录,需要实施的Java -Dauto -Drecursive org.apache.solr.util.SimplePostTool文档/ 。 我得到它说的错误:无法找到或加载主类org.apache.solr.util.SimplePostTool inspite密切关注快速入门教程。我没有得到如何解决错误并继续推进本
..
我学习的NoSQL,看着为我的客户的要求之一不同的选择。我通过各种资源,搭建了这个问题(在NoSQL的小知识的人)去之前 我需要以更快的速率将数据存储和读取数据。 全故障安全和易于扩展。 能够通过数据分析进行查询。 我结束了的短名单:卡桑德拉和Elasticsearch 我所理解的是Cassandra是对我来说是完美的NoSQL存储解决方案,因为我可以写数据,并使用索引读取数据。
..
Lucene的有一个默认的StopFilter(
..
我编译使用ant的编译一个.java文件。我正在以下errror “包org.apache.commons.io不存在错误” 我下载了Apache下议院IO二进制文件和粘贴的.jar文件 “C:\\ Program Files文件\\的Java \\ jdk1.7.0_51 \\ lib目录\\ missioncontrol \\插件” 任何帮助。我是否需要修改我的生成的XML文件的cla
..
我有一个包含表单的XML字符串变量: <项目> < descriptin> ABC< /描写的特征> <标题>&高清LT; /标题> < /项目> 我要显示在列表视图标题的文本的,但是当我用我得到的XML:一个String = hitdoc.get(“文本”) 我在android系统与Lucene搜索工作是
..
我有一个项目需要的Lucene( 4.3.0 ),并添加以下dependenies: Lucene的核心,lucene的-分析仪常见,lucene的-查询的Lucene QueryParser的。 和,之后添加lucene- codeCS的依赖,也得到了同样的错误。 不过,Lucene的核心的jar包含在 codeC 类 -----开始异常----- I / TestRunner的(24
..