full-text-search相关内容

PostgreSQL-使ts_RANK按原样接受ts_VECTOR位置或定义自定义的ts_RANK函数

我在一家电子商务平台上对一系列商品进行加权搜索。我遇到的问题是ts_rank为不同的单词组合提供了完全相同的值,即使ts_VECTOR为每组单词提供了不同的位置。 让我举个例子来说明一下: 如果我将单词camas赋给ts_VECTOR,则会得到以下结果: 'cam':1 如果我将单词sofas camas赋给ts_VECTOR,则会得到以下结果: 'cam':2 'so ..
发布时间:2022-08-04 11:09:44 其他开发

在MySQL中搜索相似的单词

我有一个数据库,里面有一张叫毒品的桌子。其中有一个名为“Description”的字段,它有一个全文索引。我想搜索类似的词‘AciFree-O 10ml’,‘AciFree O 10ml’。 我尝试了以下查询, SELECT * FROM drugs where SOUNDEX(Description) = SOUNDEX('Acifree -O 10ml'); 但查询返回以下值 ..
发布时间:2022-08-04 10:58:41 数据库

忽略SQL Server中全文搜索(FREETEXTTABLE)搜索列中的破折号(-)

我使用CONTAINSTABLE作为我的搜索算法。我想搜索列值,忽略破折号,特别是列值。例如,列包含‘12345-67’,则应使用‘1234567’进行搜索,如下所示。 SELECT * FROM table1 AS FT_Table INNER JOIN CONTAINSTABLE(table2, columnname, '1234567') AS Key_Table ON FT_Tab ..

全文搜索中的多个同义词词典匹配

我正在尝试在PostgreSQL8.3中执行全文搜索。它工作得非常好,所以我使用同义词词典添加了同义词匹配(例如'bob' == 'robert')。这也很管用。 但是,我注意到它显然只允许一个单词有一个同义词。也就是说,al不能为albert或allen。 这样对吗?有没有办法在PostgreSQL同义词词典中有多个词典匹配项? 作为参考,下面是我的示例字典文件: bob ..
发布时间:2022-03-01 11:20:59 其他开发

全文搜索(Postgres)与弹性搜索

阅读Query 在Posgres中,全文索引允许对文档进行预处理,并保存索引以供以后快速搜索。预处理包括: 正在将文档分析为令牌。 将标记转换为词位。 存储针对搜索进行优化的预处理文档。 tsvector类型在Postgres中用于全文搜索 tsvector类型与text类型在以下方面不同: 消除大小写。大写/小写字母相同 删除停止字词(and,or,n ..

Postgres或CouchDB中的全文搜索?

我取了geonames.org,导入了他们所有地区的德国城市的所有数据。 如果我输入&Hamburg";,它会列出&Hamburg Center、汉堡机场等。该应用程序处于封闭的网络中,无法访问互联网,因此我无法访问geonames.orgweb服务,因此必须导入数据。:( 这座城市及其所有的区都是作为一个汽车配件来工作的。因此,每次击键都会导致XHR请求,依此类推。 现在我的 ..

使用Spring-data JPA中的项目列表使用CONTAINS查询搜索多列

我正在开发一个图书馆API,我的目标是搜索一本书。目前,这本书有两个我要搜索的有趣的值:标题和格式回复信息(书背面的文本)。 基础数据库为MariaDB。 我构造了一个JPA查询: Iterable findByTitleContainsOrBlurbContains(String query, String query2) query和query2的内容相同。对 ..
发布时间:2022-02-24 11:41:58 Java开发

TDictionary 保存到文件

我有很多文件(大约 160 000 个),我需要有关文件中单个单词位置的信息(全文).所以我像这样使用字典: WordDict : TDictionary 现在我知道 WORD1 在 FILE1、FILE3 和 FILE100 以及每个文件 、 等中的位置.我可以填充它,我可以使用它——它非常快.但我不知道如何有效地将字典存储到文件中. 编辑:有效 - 我的意思是文件的快速和小尺寸 ..
发布时间:2022-01-24 19:09:04 其他开发

VIM 的快速“在文件中查找"?

有哪些选项可以在 VIM 中快速“在文件中查找"搜索? 我们的代码库足够大,搜索需要使用索引.grep/vimgrep/etc 太慢了. 索引不需要特别快;我可以在一夜之间建立索引. 谢谢, [编辑] 我也在 Windows 环境中工作. 解决方案 如果是源代码(而不是全文搜索),那么带有 TagList 插件的 ctags 应该可以很好地满足您的需求.参见,例如: ..
发布时间:2022-01-20 17:24:54 其他开发

你如何让你的全文布尔搜索来选择术语 C++?

所以,我需要了解如何在 MySQL 数据库上进行全文布尔搜索,以返回包含术语“C++"的记录. 我的 SQL 搜索字符串为: 选择 *来自我的表匹配位置(字段 1、字段 2、字段 3)反对(布尔模式下的“C++") 虽然我的所有字段都包含字符串 C++,但它从未在搜索结果中返回. 如何修改 MySQL 以适应这种情况?是否可以? 我找到的唯一解决方案是在输入数据的过程中转义 ..
发布时间:2022-01-19 17:42:49 数据库

在 MySQL 中的全文搜索前添加 *(星号)

我知道星号是可以附加到全文搜索词末尾的通配符,但是如果我搜索的关键字是后缀怎么办?例如,我希望能够搜索“ames"并返回包含名称“james"的结果.这是我当前的查询,它不起作用,因为您不能在全文搜索前添加星号. SELECT * FROM table WHERE MATCH(name, about, address) AGAINST ("*$key*" IN BOOLEAN MODE) 我会 ..
发布时间:2022-01-19 17:31:10 数据库

用于标记、云和搜索的最佳数据架构(如 StackOverflow)?

我很想知道 Stack Overflow 的标记和搜索是如何构建的,因为它似乎工作得很好. 如果我想做以下所有事情,什么是好的数据库/搜索模型: 在各种实体上存储标签(标准化程度如何?即实体、标签和 Entity_Tag 表?) 搜索带有特定标签的项目 构建适用于特定搜索结果集的所有标签的标签云 如何在搜索结果中显示每个项目的标签列表? 也许以标准化形式存储标签是有意义的, ..
发布时间:2022-01-18 21:42:47 其他开发

如何实现词性 (POS) 标注器

我正在寻找基于 PHP 的最佳方式来扫描大量文本条目(分类广告)并提取关键字 - 有人知道词性标记吗?有没有类似 PHP 的方法来做到这一点? 我扫描了很多在线分类广告 - 但没有一个分类!为了加快分类过程,我希望安装一个词性标注器 (http://en.wikipedia.org/wiki/Part-of-speech_tagging).基本上,这些是很酷的文本解析算法软件包,可以告诉我哪 ..
发布时间:2022-01-18 21:30:18 PHP

HTML 中的全文搜索忽略标签/&

我最近看到了很多用于在 HTML 页面中搜索和突出显示术语的库.但是,我看到的每个库都有同样的问题,他们找不到部分包含在 html 标记中的文本和/或他们无法找到 & 表示的特殊字符. 示例: 这是一个测验.这是一个测试太 搜索“测试";会找到第一个实例,但不会找到第二个. 示例b: 铅笔在西班牙语中被称为 láp ..
发布时间:2022-01-18 20:52:36 前端开发