full-text-search相关内容

MySQL match() against() - 按相关性和列排序?

好的,所以我尝试在多列中进行全文搜索,就像这样简单: SELECT * FROM pages WHERE MATCH(head, body) AGAINST('some words' IN BOOLEAN MODE) 现在我想按相关性排序,(找到多少个词?)我已经能够用这样的东西来做: SELECT * , MATCH (head, body) AGAINST ('some words' I ..
发布时间:2021-11-20 21:38:10 数据库

选择独立的全文搜索服务器:Sphinx 还是 SOLR?

我正在寻找具有以下属性的独立全文搜索服务器: 必须作为独立服务器运行,可以为来自多个客户端的搜索请求提供服务 必须能够通过索引 SQL 查询的结果来进行“批量索引":比如“SELECT id, text_to_index FROM documents;" 必须是免费软件,并且必须在使用 MySQL 作为数据库的 Linux 上运行 必须快(排除 MySQL 的内部全文搜索) 我发 ..
发布时间:2021-11-20 21:35:41 数据库

搜索“全字匹配"在 MySQL 中

我想编写一个在文本字段中搜索关键字的 SQL 查询,但前提是它是“全词匹配"(例如,当我搜索“rid"时,它不应匹配“arid",但它应该匹配“arid". 我正在使用 MySQL. 幸运的是,在这个应用程序中,性能并不重要,而且数据库大小和字符串大小都很小,但我更愿意在 SQL 中而不是在驱动它的 PHP 中进行. 解决方案 您可以使用 REGEXP 和 [[: ..
发布时间:2021-11-20 21:28:04 数据库

全文搜索引擎对比——Lucene、Sphinx、Postgresql、MySQL?

我正在构建一个 Django 站点,我正在寻找一个搜索引擎. 一些候选人: Lucene/Lucene with Compass/Solr 狮身人面像 Postgresql 内置全文搜索 MySQl 内置全文搜索 选择标准: 结果相关性和排名 搜索和索引速度 易于使用且易于与 Django 集成 资源要求 - 网站将托管在 VPS 上,因此理想情况下 ..
发布时间:2021-11-20 21:17:11 数据库

使用数据存储 (NDB)、搜索 API 或两者来查看数据?

在 CMS 中,使用带排序的常规 NDB 查询检索客户列表.为了允许过滤姓名、公司名称和电子邮件,我创建了几个(有时很多)索引.情况并不理想,但可行. 现在有了(实验性的)搜索 API.它似乎与数据存储区(或 NDB)无关,但我的数据已经在那里了. 我想使用全文搜索并同时在多个字段上放置过滤器,所以我应该将数据保留在数据存储区中并在文档中复制部分数据以供搜索 API 使用吗?或者,如搜 ..

单机性能上的多个分片

如果我只使用一台机器,在 Elasticsearch 中拥有多个分片是否有意义?它会以任何方式提高性能吗? 关于 Apache Solr 的相同问题 - 将 Solr Cloud 与 ZooKeeper 用于单个服务器实例是否有意义,还是仅创建一个核心而不进行任何分片? 假设我以后不打算使用其他机器,那么重点是单台机器上的分片如何影响搜索引擎的性能? 解决方案 Lucene 的 ..

Solr 搜索关键字后打开文档

我正在尝试索引一些 PDF 文档,然后创建一个搜索用户界面. 这个问题有点关系 Solr 索引 PDF 文档并发布它们到远程服务器 1) 索引 PDF 文档 - > 我使用 tika jar 将 PDF 转换为文本文件,然后使用 curl 命令来索引它们. 2) 搜索用户界面 --> 我正在使用 Solritas 浏览功能及其内置用户界面. 目标: 当我在索引文 ..
发布时间:2021-11-14 23:46:21 其他开发

在solr中获取pdf搜索结果的页码

我正在构建一个 Web 应用程序,用户可以在其中搜索 pdf 文档并使用 pdf.js 查看它们.我想显示搜索结果,其中包含找到搜索词的段落的一小段片段以及在右侧页面打开文档的链接. 所以我需要的是每个搜索结果的页码和一个简短的文本片段. 我正在使用 SOLR 4.1 来索引 pdf 文档.索引本身工作正常,但我不知道如何获取搜索结果的页码和段落. 我在这里找到了这个“使用 So ..
发布时间:2021-11-14 23:46:06 其他开发

如何在 SOLR 中索引文档?

我在 Ubuntu 10.04(通过 apt-get solr-tomcat 安装)上运行 Solr 1.4,它似乎工作正常.不过,我很难找到有关如何索引文档的任何连贯信息.我是 SOLR 的新手,所以请耐心等待!我有一个文件夹 (/mnt/folder),它是一个挂载的 Windows 共享,其中包含我想要索引的 Word 和 PDF 文件,让 SOLR 索引整个文件夹的最简单方法是什么? ..
发布时间:2021-11-14 23:44:17 其他开发

使用 Solr 索引 PDF

谁能给我指点教程. 我使用 Solr 的主要经验是索引 CSV 文件.但是我找不到任何简单的说明/教程来告诉我索引 pdf 需要做什么. 我见过这个:http://wiki.apache.org/solr/ExtractingRequestHandler 但这对我来说意义不大.我需要安装 Tika 吗? 我迷路了 - 请帮忙 解决方案 其中最难的部分是使用 Aper ..
发布时间:2021-11-14 23:44:04 其他开发

Jquery Bootstrap 手风琴常见问题解答

我正在处理一个相当大的常见问题解答页面,该页面需要包含多个部分.它需要一个高效的搜索功能,我已经把一个基于以前的答案,但我'我坚持几点. 搜索功能不起作用 - 似乎没有选择正确的“panelContainerId" 如何将多个手风琴 ID 组合到搜索功能中 如何在结果中突出显示搜索词 这是我的工作代码 - 也见下文 https://jsfiddle.net/clappertrapp ..

检查服务器状态时出现 Elasticsearch 503 错误

我一直在使用 elasticsearch 作为 Rails 应用程序的搜索引擎,但是由于我无法理解的原因,它停止正常工作.向 elasticsearch 服务器发出 curl 请求时,我收到 503 错误. curl -XGET http://localhost:9200{“好的":真的,“状态":503,"name" : "杀伤力",“版本" : {“数字":“0.90.3","build_h ..
发布时间:2021-07-17 19:51:10 其他开发

在 PyCharm 中查找多个项目的文件

如何使用“在文件中查找"选项?(Ctrl + Shift + F 或 ⇧⌘F) 适用于 PyCharm 中的多个或所有项目?例如,如果我有项目“foo"和项目“bar",我如何使用“在文件中查找"?当我在项目“foo"中时还想看“bar"的搜索结果吗? 解决方案 如何使用“在文件中查找"选项?(Ctrl+Shift+F 或 ⇧⌘F) 用于 PyCharm 中的多个或所有项目? 在 ..
发布时间:2021-06-23 19:52:49 Python

我可以以编程方式配置 PostgreSQL 以不消除全文搜索中的停用词吗?

我正在使用 PostgreSQL 全文搜索来搜索一个项目,在该项目中传统的停用词('a'、'the'、'if' 等)应该被索引和搜索,这不是默认行为.例如,我可能希望我的用户找到查询“to be or not to be"的结果. 文档 表明我可以通过创建$SHAREDIR/tsearch_data/english.stop 中的空停用词字典(例如),但这会使部署复杂化;我希望能够使用 SQ ..
发布时间:2021-06-18 20:39:36 其他开发

MySQL 错误 1032 "Can't find record in table"

我昨天在 dba.stackexchange.com 上问了这个问题,但没有得到任何回复,所以我正在这里尝试. 对于我的数据库中的某些查询,我收到 MySQL 1032“无法在‘person’中找到记录"错误,但我无法解决这些错误. 这是表: CREATE TABLE `person` (`id` int(11) NOT NULL AUTO_INCREMENT,`last_name` ..
发布时间:2021-06-06 18:42:46 数据库

MySQL全文索引给出完全匹配和部分匹配的相同分数,为什么?

我在带有全文索引的mysql 5.6中有这种奇怪的行为 我正在尝试搜索患者数据库,然后首先获得精确匹配,然后按最低分按分数进行分,因此我不会返回100000+结果,只是一些建议,以防止重复输入EHR类型的应用程序 问题是完全匹配和部分匹配具有相同的分数... 这是预期的行为吗?我有什么选择? “相关性是根据行中的单词数,该行中唯一单词的数量,集合中单词的总数以及包含特定单词 ..
发布时间:2021-05-15 21:07:38 数据库