text-search - IT屋-程序员软件开发技术分享社区

MongoDB文本搜索精确短语

我有一个包含以下文档的集合： { "_id" : ObjectId("5ad609a2ac1a8b644180936a"), "content" : "Coffee and cakes..." }, { "_id" : ObjectId("5ad609baac1a8b644180936b"), "content" : "coffee shop..." } ..

发布时间：2022-06-28 14:36:47 mongodb mongodb-query full-text-search text-search 其他开发

如何使用 pymongo 创建索引

我想在我的 Mongo 数据库中的特定字段中启用文本搜索.我想在 python (-> pymongo) 中实现这个搜索.当我按照互联网上的说明进行操作时: db.foo.ensure_index(('field_i_want_to_index', 'text'), name="search_index") 我收到以下错误消息: 回溯(最近一次调用最后一次):文件“CVE_search.p ..

发布时间：2021-12-21 23:47:29 mongodb indexing pymongo fuzzy-search text-search 其他开发

MongoDB diacriticInSensitive 搜索未按预期显示所有重音(带有变音符号的单词)行，反之亦然

我有一个具有以下结构的文档集合 uid，名称带索引 db.Collection.createIndex({name: "text"}) 它包含以下数据 1, iphone2、iphone3、iphone4、伊芙妮当我对 iphone 进行文本搜索时我只得到了两条记录，这是出乎意料的实际输出--------------1、苹果手机2、iphone 如果我搜索 iphonë d ..

发布时间：2021-12-20 14:18:09 mongodb search diacritics text-search accent-insensitive 其他开发

在几十个 JAR 文件中的某个地方找到一个类?

如何在大量 jar 文件中找到特定的类名? (寻找实际的类名，而不是引用它的类.) 解决方案 Unix 在 Linux、其他 Unix 变体、Windows 上的 Git Bash 或 Cygwin 上，使用 jar(或 unzip -v)、grep, 和 find 命令. 以下列出了与给定名称匹配的所有类文件: for i in *.jar;做 jar -tvf "$ ..

发布时间：2021-12-09 21:09:58 java class jar project-structure text-search Java开发

谷歌“你的意思是什么?"是什么意思?算法工作?

我一直在为投资组合管理工具开发一个内部网站.有很多文本数据、公司名称等.一些搜索引擎能够非常快速地响应“您的意思是:xxxx"查询的能力给我留下了深刻的印象. 我需要能够智能地接受用户查询并不仅用原始搜索结果而且用“你的意思是?"来回应.当有一个很可能的替代答案时的响应等 [我正在 ASP.NET(VB - 不要持有它反对我！)] 更新:好吧，如果没有数百万“未付费用户"，我该如 ..

发布时间：2021-12-06 19:23:47 algorithm machine-learning nlp spell-checking text-search AI人工智能

如何在 JAVA 中搜索阿拉伯文本?

我在数据库中有带有变音符号的阿拉伯语文本.当我输入阿拉伯语来搜索某个字符串时，它没有变音符号，这肯定与数据库字符串不匹配.它在没有变音符号的文本上运行良好.有没有办法在带有变音符号的文本上运行它??? 解决方案有没有办法在带有变音符号的文本上运行它??? 不幸的是没有.就像 MIE 说的: 阿拉伯语变音符号是字符所以据我所知，这不太可能. MIE 的答案将难 ..

发布时间：2021-11-17 01:23:06 java android arabic text-search Java开发

如何在JAVA中对阿拉伯文本进行搜索?

我的数据库中有带有变音符号的阿拉伯文字.当我键入阿拉伯语来搜索某些字符串时，它没有变音符，肯定与数据库字符串不匹配.它在没有变音符号的文本上效果很好.有什么办法可以在带有变音符号的文本上运行它? 解决方案有没有办法在带有变音符号的文本上运行它? 不幸的是，没有.就像MIE所说的: 阿拉伯音符是字符据我所知，这实际上是不可能的. 如果更改数据库中的任何内容，M ..

发布时间：2020-09-06 18:46:59 java android arabic text-search Java开发

如何在git存储库中列出我当前的所有TODO消息?

我想查看所有只有我编写的并在git管理的当前代码库中存在的TODO注释. 到目前为止，正在打印我在完整git历史记录中创建或修改的所有TODO注释:git log -p --author="My name" -S TODO | grep "\+.*TODO" 但是这个工具链列出了所有曾经写过的TODO注释，甚至那些我已经解决并因此又从代码中删除的注释. 什么是合适的工具链，可 ..

发布时间：2020-07-11 00:23:39 git git-commit todo text-search 其他开发

根据文本选择连接字段的值Oracle SQL

我有一个表a_x，其中有A列和B列，A列为CLOB格式，B列的编号为(10): A | B -----------------------------|------- atveroeosipsumloremipsumdolor| 1 stetclitakasdtest ..

发布时间：2020-05-22 04:21:14 sql oracle11g grouping string-concatenation text-search 其他开发

MongoDB:使用变量进行文本搜索(完全匹配)

MongoDB 3.4 我有一个变量值. val1 =“小堡" 我需要在集合存储中搜索(名称字段上带有文本索引)，其文档为 db.stores.insert([ { _id: 1, name: "Java Hut", description: "Coffee and cakes" }, { _id: 2, name: "Burger Buns", descri ..

发布时间：2020-05-11 01:45:37 mongodb text-search exact-match 其他开发

猫鼬用部分字符串进行文本搜索

嗨，我正在使用猫鼬来搜索我的收藏夹中的人. /*Person model*/ { name: { first: String, last: String } } 现在我要搜索有疑问的人: let regex = new RegExp(QUERY,'i'); Person.find({ $or: [ {'name.fir ..

发布时间：2020-05-10 23:29:08 node.js mongodb mongoose text-search 其他开发

MongoDB diacriticInSensitive搜索未按预期显示所有带重音(带有音符标记的单词)行，反之亦然

我有一个具有以下结构的文档集合 uid, name 带有索引 db.Collection.createIndex({name: "text"}) 它包含以下数据 1, iphone 2, iphóne 3, iphonë 4, iphónë 当我在搜索iphone的文本时我只有两条记录，这是意外的 actual output -------------- 1, ..

发布时间：2020-05-10 22:59:02 mongodb search diacritics text-search accent-insensitive 其他开发

如何使用pymongo创建索引

我想在Mongo数据库中的特定字段上启用文本搜索.我想在python(-> pymongo)中实现此搜索.当我按照互联网上的指示进行操作时: db.foo.ensure_index(('field_i_want_to_index', 'text'), name="search_index") 我收到以下错误消息: Traceback (most recent call la ..

发布时间：2020-05-10 22:54:09 mongodb indexing pymongo fuzzy-search text-search 其他开发

为现有的Apache Jena TDB创建Lucene索引以实现文本搜索

我有一个大型的Apache Jena TDB，我想使用Apache Jena 2.10.2构建一个Lucene索引，以便与新的文本搜索功能一起使用.我发现文档难以理解. 我首先尝试在代码中使用配置，但是在依赖项方面遇到了麻烦. lecene-core和solr-solrj的任何组合都将导致某些"classNotFound"错误或"StandardAnalyzer覆盖最终方法tokenStre ..

发布时间：2020-05-04 07:58:17 jena lucene text-search tdb 其他开发

Javascript在字符串中找到单词的索引（不是单词的一部分）

我目前正在使用 str.indexOf（“word”）来查找字符串中的单词。但问题在于它还会返回其他单词的部分内容。示例：“我去了foobar并订购了foo。” 我想要单词“foo”的第一个索引，而不是foobar中的foo。我无法搜索“foo”因为有时它可能后跟一个句号或逗号（任何非字母数字字符）。解决方案你必须使用正则表达式为此： > “我去了fooba ..

发布时间：2019-05-24 21:14:21 javascript regex search indexof text-search 前端开发

在几十个JAR文件中找到一个类？

如何在大量jar文件中找到特定的类名？（查找实际的类名，而不是引用它的类。）解决方案 Unix 使用 jar （或 unzip -v ）， grep 和 find 命令。例如，以下内容将列出与给定名称匹配的所有类文件： for i in * .jar;做jar -tvf“$ i”| grep -Hsi ClassName&&回声“$ i”;完成 ..

发布时间：2018-11-19 13:01:01 java class jar project-structure text-search Java开发

灵活的滑动窗口（Python）

问题描述：我有兴趣查看文本窗口中的术语，例如，左边3个单词，右边3个单词。基本情况具有w-3 w-2 w-1项w + 1 w + 2 w + 3的形式。我想在我的文本上实现一个滑动窗口，我可以用它来记录每个术语的上下文单词。因此，每个单词都被视为一个术语，但是当窗口移动时，它会变成上下文单词等。但是，当该术语是第一个单词时，左边没有上下文单词（t w + 1） w + 2 w + 3），当它是第二 ..

发布时间：2018-11-15 22:30:24 python text iterator text-search sliding-window Python

如何在当前的git托管代码库中列出我所有的TODO消息

我希望看到只有的所有TODO评论，并且存在于当前git托管的代码库中。我到目前为止所做的是打印我在完整的git历史记录中创建或修改的所有TODO注释： git log -p --author =”My名称“-S TODO | grep“\ +。* TODO” 但是这个工具链列出了所有写过的TODO评论，甚至包括那些我已经解决然后再从代码中删除。有没有一种工具可以逐行搜索当前 ..

发布时间：2018-04-26 19:00:35 git git-commit todo text-search 其他开发

大数据集上的余弦相似性

目前我正在研究数据挖掘，文本比较，并发现了这一点： https：// en.wikipedia.org/wiki/Cosine_similarity 。由于我已经成功实现了这个算法来比较两个字符串，我决定尝试一些更复杂的任务实现。我已经遍历了包含大约 250k 文档的数据库，并将DB中的一个随机文档与该数据库中的整个文档进行了比较。比较所有这些项目的时间：316.3589859 ..

发布时间：2018-04-16 16:35:02 php full-text-search cosine-similarity text-search PHP

如何使用MongoDB在文档中的所有字段上搜索单词或字符串？

我们有一种情况，用户希望在文档中的任何位置有一个用于搜索单词的单一'全方位'。是MongoDB能够执行此搜索，还是必须对每个字段进行显式搜索？您需要创建一个通配符文本索引像这样： db.collection.createIndex（{“$ **”：“text” }）您可以使用 $ text 运算符执行文本搜索。 p> 正如文档中提到的那样：该索引允许在所有字段 ..

发布时间：2018-04-16 16:30:53 mongodb full-text-search mongodb-query text-search 其他数据库

text-search相关内容