其他数据库

CouchDB全文搜索

我需要一些关于在couchdb中进行全文搜索的指导。它是否已经在2.0中默认启用,或者我们是否需要重建couchdb来启用它? 场景: 这是一个文档管理系统,显示文档在网格中。我需要能够对结果进行排序。在从map减少到弹性索引之后,现在我试图使用芒果查询。 { “selector”:{ “ directoryName“:{ ”$ eq“:”mail\\test\\inbox“ }} ..

如何搜索相似的单词

我有一个记录文件,我需要制作一个程序,通过在搜索字段中输入一个单词来帮助找到该记录中的任何单词。记录文件包含单词列表,所以我需要搜索该列表以找到任何可能与我的单词相似的单词。 我使用的是Delphi 2007 2007年应该有一个StrUtils中使用Soundex算法查找类似“声音”单词的字符串匹配例程数。根据您的文件格式化方式,您可以将其加载到TStringList中,然后在输入字段的O ..
发布时间:2018-04-16 16:29:34 其他数据库

弹性搜索。聚合中_Score为空。为什么?

我使用ES v 1.7。 ES仅在“点击”部分返回_score,但我对“点击”不感兴趣,因此我需要使用_score 响应的“聚合”部分的数据。为什么ES这样做和如何解决它? Requset: “size”:1, “query”:{ “bool”:{ “must”:[ {“match”:{“_all”:{“query”:“test”,“operator”:“and”,“fuzzi ..

如何实现solr过滤器?

我对查询处理的理解是否正确? 从缓存中获取DocSet或实现OpenBitSet或SortedVIntSet并对其进行缓存 从缓存中获取DocSet 所有其他过滤器创建它们的DocBitSet实现,它将与原始文件(这个代码的效率取决于DocSet的第一个实现的实现)我们使用Lucene过滤器+查询搜索()使用MainQuery和最终的DocSet(在所有交集之后)进行leapfrog跳转( ..
发布时间:2018-04-16 16:29:01 其他数据库

实体框架5,代码优先,全文搜索,但通过CreateQuery IQueryable?

我使用Code First方法使用.NET 4.5和EF 5,现在我需要实现全文搜索。 我已经阅读了很多内容,到目前为止,我的结论是: 存储过程和表值函数不能使用Code First映射。 em> dbContext.Database.SqlQuery(Sql,parameters) 但是这会返回IEnumerable我想要IQueryable,这样我可以在从数据库服 ..

ravendb结合搜索与地点

我正在C#中执行乌鸦查询,并使用Where()和Search()扩展方法。 我需要这两个功能,因为我只需要返回具有特定Guid字段的索引,以及存在于文本正文中的文本。 不幸的是,Where扩展方法似乎与Search扩展方法不兼容。当我将它们结合起来时,我得到了一个像这样的Lucene查询: Query:FeedOwner:25eb541c\-b04a\-4f08\\ \\ -b468 ..
发布时间:2018-04-16 16:28:15 其他数据库

索引Word / PDF文档从文件系统到SQL Server

我试图想出一个简单的解决方案来解决我遇到的问题,因为到目前为止我发现的所有这些看起来都太复杂了! 是我们使用专有应用程序来管理我们业务的大部分方面。它有一个相当大的SQL Server 2005后端数据库。该应用程序还允许将Word和PDF文档附加到我们广泛使用的记录中,并将这些文件存储在服务器上的文件系统中,并在数据库中引用文件名。不幸的是,应用程序中的搜索设施很差,所以我正在尝试构建自己 ..
发布时间:2018-04-16 16:28:01 其他数据库

PostgreSQL使用tf-idf吗?

我想知道PostgreSQL 9.3中带有GIN / GiST索引的全文搜索是否使用tf-idf(术语频率逆文档频率)。 特别是,在我的专栏中,我有一些更受欢迎的词,而有些词则非常独特(即名称)。我想索引这些列,以便匹配的唯一字的权重会高于常用字。 解决方案 在ts_rank函数中,没有使用全局(语料库)频率对结果进行排名的本机方法。然而,排名算法根据文档中的频率排名: http:/ ..
发布时间:2018-04-16 16:27:58 其他数据库

如何为B2B网站应用程序设置Lucene / Solr?

给定: 每个客户端(企业客户)1个数据库 5000个客户端 客户端拥有2到2000个用户(平均大约100个用户/客户端) 每个数据库100k到1000万条记录 用户需要经常搜索这些记录(这是导航他们数据的最佳方式) 可能有关的信息: 每周有几位新客户(工作时间内的任何时候) 多个Web服务器和数据库服务器(用户可以通过任何Web服务器登录) 由于Lucene(和Sol ..
发布时间:2018-04-16 16:27:49 其他数据库

postgresql中的Postgresql全文搜索 - 日语,中文,阿拉伯语

我正在为我当前的项目设计postgresql中的全文搜索功能。 到目前为止,它与ispell / myspell字典无关。 现在我需要添加对中文,日文和阿拉伯文搜索的支持。 我从哪里开始? 据我所知,没有可用于这些语言 的模板或词典。 是否可以与pg_catalog.simple配置一起工作? 手册:大量词典列表可在 OpenOffice Wiki 。 ..

预测自动推理逻辑

我想在我的网站上实施预测性自动推荐。我已经使用Solr来提高搜索性能。但经过最近2天的调查,我了解到Solr没有任何内置软件包或支持来实施预测性建议,如亚马逊或flipkart搜索。任何人都可以告诉我什么是实施预测性建议的简单逻辑 或者哪些技术支持这种类型的搜索建议? 期望的工作流程如下, 如果用户搜索字符串“samsung”,我们的自动消息应该显示如下的分组建议, 手机中的三 ..
发布时间:2018-04-16 16:27:04 其他数据库

在Apache Solr中搜索书籍

我对Solr很新,我正在评估它。我的任务是在书籍库中查找单词,并在小范围内将它们返回 。到目前为止,我将书籍存储在按段落分割的数据库中(通过换行来切分书籍),我执行全文搜索并返回行。 在Solr,我是否也必须这样做,还是可以添加整本书(采用.txt格式),并且每当找到匹配项时,就会返回类似于匹配的内容加上前100个单词和后面100个单词之类的内容?谢谢 解决方案 突出显示会执行您的出 ..
发布时间:2018-04-16 16:27:01 其他数据库

SOLR / LUCENE专家,请帮我设计一个简单的关键字从PDF索引搜索?

我有: 我曾经用过solr,但找不到一种方法来定制它。 p> 一堆PDF文件。 一组关键字。 我试图达到的目标: 索引PDF文件(solrcell - done) 搜索关键字(可以正常工作) 定制输出以清除PDF文件的名称,出现关键字的摘录(无关紧要) / idea如何) 尝试操作ResponseHandler / Schema.xml / Solrconfig.x ..
发布时间:2018-04-16 16:26:43 其他数据库

Neo4j:使用node_auto_index / lucene索引对32k以上的属性进行索引

我试图建立一个小文件和电子邮件搜索引擎。我还想为全文搜索使用更高级的搜索查询。因此我正在查看lucene索引。从我所看到的,有两种方法 - node_auto_index和apoc.index.addNode。 设置索引可以正常工作,索引具有小属性的节点可以工作。当尝试为大于32k的属性索引节点时,neo4j失败(并进入不可用状态)。 错误消息归结为: $ b 警告:无法调用过 ..
发布时间:2018-04-16 16:26:31 其他数据库

仅显示MongoDB文本搜索的匹配字段

我是Mongo的新手,并且希望为Web前端实现文本搜索功能。我在“文本”索引中的集合中添加了所有文本字段,因此搜索会在所有字段中找到匹配项。文件可能很重。 问题是,当我收到整个匹配文件而不仅仅是匹配字段。我只想得到匹配的字段以及文档 _id ,所以我可以在Web类型提示中提供一些提示,并且当用户选择匹配时,我可以通过 _id 加载整个文档。 有一个 $ project code>运算符 ..
发布时间:2018-04-16 16:26:26 其他数据库

MongoDB全文搜索 - 匹配单词和精确短语

我目前在MongoDB中有全文搜索功能的问题。特别是在试图匹配确切的短语时。 我正在测试mongo shell的功能,但最终我将使用Spring Data MongoDB和Java。因此,我首先尝试运行此命令来搜索单词“延迟”,“迟到”和短语“按时”。 db.mycollection.find({$ text:{$ search:“delay late \”on time \“”}} ..