whoosh相关内容

使用 Whoosh Python 搜索库进行文档比较/相似性

如何使用 Whoosh 获取文档的相似性度量? 我想创建一个“相关"功能,对与某个文档具有高度相似性的其他先前编入索引的文档进行排名. 我是否将文档作为长查询字符串输入?我是否将文档添加到索引并从那里以某种方式提取相似性查询结果? 谢谢 解决方案 Whoosh 搜索器类有一个名为 'more_like()'. 它允许您将文档与其他索引文档进行比较和索引,并返回与给定 ..
发布时间:2021-07-17 19:57:03 Python

我的输出没有提供与查询匹配的文档

我有一个名为 pads 的文件夹,其中有六个记事本文档,每个文档都有一些文本.我正在尝试构建一个 whoosh 代码,该代码将为查询字符串返回适当的文档,但正在作为运行时获取输出,感谢帮助 导入操作系统从 whoosh.index 导入 create_in从 whoosh.fields 导入架构、文本、ID导入系统从 whoosh.qparser 导入 QueryParser从 whoosh 进 ..
发布时间:2021-06-13 19:31:58 Python

通过信息检索中的Whoosh语言模型

我在IR工作. 任何人都可以指导我,如何在Whoosh中实现语言模型. 我已经应用了TD-IDF和BM25.我是IR的新手. 例如,语言模型的最简单形式只是丢弃所有条件上下文,并独立估计每个术语.这样的模型称为unigram语言模型: P_{uni}(t_1t_2t_3t_4) = P(t_1)P(t_2)P(t_3)P(t_4) 还有许多更复杂的语言模型,例如bigram语 ..
发布时间:2020-11-27 21:44:49 Python

Flask应用搜索栏

我正在尝试使用Flask实现搜索栏,但是当我输入url/search时,出现405错误,不允许使用方法. 这是我的代码的摘要.任何帮助将不胜感激! forms.py from wtforms import StringField from wtforms.validators import DataRequired class SearchForm(Form): searc ..
发布时间:2020-11-08 07:49:33 Python

(干草堆+飞快移动){{result.object.get_absolute_url}}无法正常工作

我正在django(1.7)网站中使用haystack(2.1.1)和whoosh。我很高兴,因为它正在工作,但并不完全。该应用显示正确的搜索,但是当我单击搜索结果时,它不会转到产品页面。看来我尚未配置某些使{{result.object.get_absolute_url}}无法正常工作的功能。我希望你们中的任何一个都可以帮助我(作为参考,我把所有代码都放进去了) 这是我的应用程序模型(产品 ..
发布时间:2020-10-23 20:54:02 其他开发

找不到结果-haystack django whoosh

我有一个大问题! 我正在使用干草堆,whoosh和django。我确定我已经按照文档完成了所有必要的工作。 但是!!!!搜索的结果是:始终“没有找到结果”。但是,如果我在表单中输入的符号是空格,则会打印出我已索引的每个对象 详细信息: 在我的search_indexes.py中,我有: 从haystack.indexes import * 从haystack导入站点 ..
发布时间:2020-10-23 20:53:58 其他开发

Django Haystack重建索引

我正在阅读Haystack的“入门指南”,并尝试使用Haystack为我的网站实施Whoosh后端。我成功设置了整个项目,并且还可以在search.html模板上看到搜索框。我无法建立索引。 键入./manage.py rebuild_index时,出现错误: 未知命令:rebuild_index 我知道这是一个小问题。我无法理解manage.py文件如何能够理解最初不属于该文件 ..
发布时间:2020-10-23 20:53:56 其他开发

干草堆/ Whoosh索引生成错误

我正在尝试使用Whoosh后端设置干草堆。当我尝试生成索引[或与此有关的任何索引命令]时,我收到: TypeError:项“来自list''不是字符串 如果我完全删除了我的search_indexes.py,则会收到相同的错误[因此我猜它根本找不到该文件] 什么可能导致此错误?它设置为自动发现,并且我确定我的应用已安装,因为我当前正在使用它。 完整追 ..
发布时间:2020-10-23 20:53:47 Python

Django-Haystack在搜索表单中未返回任何结果

我正在使用带有Whoosh后端的Django-Haystack。当我进行查询时,我没有任何结果。通过在Django shell中键入以下内容,我尝试了Haystack文档中建议的调试步骤,并且可以看到我想要的所有文本都已被索引。 从haystack.query导入SearchQuerySet sqs = SearchQuerySet()。all() sqs.count () sqs ..
发布时间:2020-10-23 20:50:27 其他开发

干草堆多字段搜索

您好,我将干草堆和woosh用作搜索引擎: 我的模型如下所示 class Person(models.Model): personid = models.IntegerField(primary_key = true,db_column ='PID') firstname = models.CharField(max_length = 50, db_column ='FIRSTN ..
发布时间:2020-10-23 20:50:13 Python

Whoosh索引查看器

我正在使用带有whoosh的haystack作为Django应用程序的后端。 有什么方法可以查看内容(以易于阅读的格式)由whoosh生成的索引?我想看看索引了哪些数据,以及如何更好地理解它是如何工作的。 解决方案 您可以执行此操作从python的交互式控制台非常容易: >>从whoosh.index import open_dir >> ix = open_dir(’who ..
发布时间:2020-10-23 20:50:07 Python

Django 2.0干草堆飞快移动更新索引,重建索引抛出错误

我正在将django 2.0与haystack + whoosh一起用作搜索。我按照文档中的说明进行配置。发生的问题是当我运行 ./ manage.py rebuild_index 时显示此错误: 追踪(最近一次通话最近): 文件“ ./manage.py”,第15行,在中 execute_from_command_line(sys.argv) 文件“ /home/zor ..
发布时间:2020-10-23 06:14:16 其他开发

部分词的文档搜索

我正在寻找一个能够搜索部分术语的文档搜索引擎(例如Xapian,Whoosh,Lucene,Solr,Sphinx或其他). 例如,当搜索"brit"一词时,搜索引擎应返回包含"britney"或"britain"的文档,或者通常返回包含与r *brit*匹配的单词的任何文档. 从零距离来看,我注意到大多数引擎都使用TF-IDF(术语频率-文档频率的倒数)或其派生词,它们基于完整术语而 ..
发布时间:2020-05-04 07:28:21 其他开发

Whoosh(Python)在哪里实际存储索引内容?

我开始研究内容索引实现,并看看Whoosh( https:/ /pypi.python.org/pypi/Whoosh/ )。 我很想知道Whoosh在哪里物理存储其内容 - 是否使用文件? 解决方案 飞快移动使用可插拔存储系统;如果您使用 create_in( )功能然后a 使用FileStorage()类将索引存储在目录中的文件中。 请参阅飞快移动快速启动: 获得架构 ..
发布时间:2018-08-02 15:36:18 Python

在Python中模糊文本搜索

我想知道是否有任何Python库可以进行模糊文本搜索。例如: 我有三个关键字“字母”,“戳记” ,和“邮件”。 我想要一个函数来检查这三个单词是否在 的同一段落内(或某些距离,一页)。 另外,这些单词必须保持相同的顺序。在这三个词之间出现其他词很好。 我试过 fuzzywuzzy Whoosh 看起来很强大,但我没有找到正确的功能...... 解决方案 {1} 您可 ..
发布时间:2018-04-16 16:20:30 Python

Flask-WhooshAlchemy与现有的数据库

我怎样才能让Flask-WhooshAlchemy为一个已经存在的数据库填充记录创建.seg文件? 通过调用: with app.app_context(): whooshalchemy.whoosh_index(app,MappedClass) 我可以得到.toc文件,但只会创建.seg文件,插入直接通过Flask-WhooshAlchemy接口记录。因此,所有已经 ..
发布时间:2017-12-12 21:36:05 Python