trigram - IT屋-程序员软件开发技术分享社区

Postgres在大型字符串行上选择iLike%TEXT%速度较慢

我有一个只有7列的表，其中一列存储了每行的长文本数据。该文本列数据的平均字符长度约为1500个字符。此表有500.000行。当我使用SELECT查询并且没有使用Text列时，没有问题，查询需要10秒。但是，如果我像Select * from table_1那样将此长文本列添加到我的查询中，则需要3到4分钟来完成此查询并使用DataAdapter填充DataTable。为什么 ..

发布时间：2022-06-29 17:51:43 sql postgresql query-optimization database-indexes trigram 其他开发

在句子列表中查找单词列表，并返回匹配的句子

如何从句子列表和单词列表返回句子列表，前提是单词列表(三元语法)中的所有三个单词都匹配。请提出建议。下面是示例列表。 listwords = [['people','suffering','acute'], ['Covid-19','Corona','like'], ['people','must','collectively']] listsent = ['The number ..

发布时间：2022-03-12 18:25:35 python nlp nltk list-comprehension trigram Python

如何在 Google BigQuery 中执行三元组运算?

我确实使用 PostgreSQL 中的 pg_trgm 模块来使用三元组计算两个字符串之间的相似度.特别是我使用: similarity(text, text) 返回一个数字，表明两个参数的相似程度(0 和 1 之间). 如何在 Google BigQuery 上执行相似度函数(或等效函数)? 解决方案试试下面的方法.至少作为增强蓝图 SELECT text1, text2, ..

发布时间：2021-12-30 22:56:55 google-bigquery similarity trigram 其他开发

优化 postgres 相似性查询(pg_trgm + gin 索引)

我定义了以下索引: 创建索引users_search_idx上授权用户使用杜松子酒(用户名 gin_trgm_ops，名字 gin_trgm_ops，姓氏 gin_trgm_ops); 我正在执行以下查询: PREPARE user_search (TEXT, INT) AS选择用户名，电子邮件，名，姓，( -- 可能会在这里做每个字段的权重s_username + s_first_name ..

发布时间：2021-06-18 20:41:55 postgresql similarity postgresql-9.6 trigram pg-trgm 其他开发

为什么Postgres Trigram word_similarity函数不使用gin索引?

postgres trigram文档指出: pg_trgm模块提供了GiST和GIN索引运算符类，允许您在文本列上创建索引，以实现非常快速的相似性搜索.这些索引类型支持上述相似性运算符，并且还支持针对LIKE，ILIKE，〜和〜*查询的基于Trigram的索引搜索. 并显示以下示例: SELECT t，word_similarity('word'，t)AS sml来自test_tr ..

发布时间：2021-05-15 21:06:37 sql postgresql indexing trigram 其他开发

使用postgres将三字组相似度和全文本搜索与Q ind django结合使用时，性能较差

我正在创建一个Web应用程序以搜索具有其属性(例如教育，经验等)的人员.我不能对所有字段都使用全文搜索，因为某些字段必须模糊匹配.(例如:如果我们搜索生物技术，则应该选择生物技术，生物技术以及生物技术).我的数据库在配置文件模型中大约有200个条目，这些条目将出现在搜索结果中. 教育和经验等其他模型通过外键连接到个人资料因此，我决定选择在哪个领域使用哪种方法.对于学位名称之类的较短字 ..

发布时间：2021-05-09 19:46:00 python django postgresql full-text-search trigram Python

PostgreSQL全文搜索缩写

我使用“德语”创建了Postgresql全文搜索。当我搜索“ Bezirk”时，该如何配置包含“ Bez”的行。也是比赛吗？（反之亦然）解决方案 @pozs是正确的。您需要使用同义词字典。 1-在$ SHAREDIR / tsearch_data目录中，创建文件german.syn，其内容如下： Bez Bezirk 2-执行查询：创建文本搜 ..

发布时间：2020-05-30 01:29:09 postgresql full-text-search pattern-matching trigram 其他开发

如何获得特定令牌前后的单词?

我目前在一个项目中工作，该项目只是创建基本的语料库数据库并标记文本.但似乎我陷入了困境.假设我们有这些东西: import os, re texts = [] for i in os.listdir(somedir): # Somedir contains text files which contain very large plain texts. with open(i, ..

发布时间：2020-05-18 01:08:54 python regex nlp text-processing trigram Python

如何在Google BigQuery中执行trigram操作？

我使用PostgreSQL中的 pg_trgm 模块来计算两个字符串之间使用卦的相似度。特别是我使用： $ p $ similar（text，text）哪个返回值返回一个数字，表示两个参数（0和1之间）的相似程度。如何在Google BigQuery上执行相似性功能（或相当功能）？ > 请在下面尝试。至少作为增强的蓝图 SELECT text1，text2，simi ..

发布时间：2018-05-07 17:26:31 google-bigquery similarity trigram 其他开发

通过相似性Postgres模糊自连接查询提高性能

我正在尝试运行一个查询，它将一个表与自己相连，并进行模糊字符串比较（使用三元组比较）来查找可能的公司名称匹配。我的目标是返回一条记录的公司名称（ref_name字段）与其他记录的公司名称匹配的三角形相似度的记录。目前，我的阈值设置为0.9，所以它只会带来很可能包含一个类似的字符串的匹配。我知道自联接可以导致许多比较性质，但我想优化我的查询最好的我可以。我不需要即时的结果，但目前运行的查询需 ..

发布时间：2017-07-21 00:47:46 performance postgresql duplicate-removal self-join trigram 其他开发

trigram相关内容