indexing相关内容

如何在 MariaDB 10 中启用大索引?

在 Debian Jessie 中,我安装了 MariaDB 服务器 10.0.30,并尝试增加最大密钥长度.AFAIU 这取决于启用的配置参数 innodb_large_prefix.根据 docs,它还需要 barracuda 文件格式和 innodb_file_per_table.在配置中设置它们并重新启动服务器后,我在客户端看到这些参数设置正确: >显示像'innodb_large%'这 ..
发布时间:2022-01-15 20:17:42 数据库

MariaDB 中的索引键大小限制是多少?

在 MySQL 中“单列索引的索引键最长可达 767 字节.相同的长度限制适用于任何索引键前缀." 查看和搜索 MariaDB 文档我找不到对此限制或类似限制的引用. 这个限制是多少? 我找不到的文档页面的链接是什么? 解决方案 有点隐蔽,但是例如 https:///mariadb.com/kb/en/mariadb/documentation/storage-engi ..
发布时间:2022-01-15 20:13:12 其他开发

在 DynamoDB 表上搜索数组项

我需要了解如何搜索作为数组一部分的 DynamoDB 的属性. 因此,在对表格进行非规范化时,假设一个人有很多电子邮件地址.我会在 person 表中创建一个数组来存储电子邮件地址. 现在,由于电子邮件地址不是排序键的一部分,如果我需要对电子邮件地址执行搜索以查找人员记录.我需要索引 email 属性. 我可以在电子邮件地址上创建一个索引吗,它与个人记录是一对多的关系,并且按照我 ..
发布时间:2022-01-15 17:42:22 其他开发

AWS DynamoDB v2:我是否需要二级索引来进行替代查询?

我需要创建一个表,其中包含由连续运行的进程生成的数据片段.此过程生成的消息包含两个强制性组件,其中包括:全局唯一消息 UUID 和消息时间戳. 这些消息稍后将由 UUID 检索. 此外,我需要定期从该表中删除所有太旧的消息,即时间戳与当前时间相差超过 X 的消息. 我一直在阅读 DynamoDB v2 文档(例如 Local Secondary Indexes) 试图弄清楚如何组 ..
发布时间:2022-01-15 17:41:47 其他开发

DynamoDB 中本地索引和全局索引之间的区别

我很好奇这两个二级索引以及它们之间的区别.很难想象这是什么样子.而且我认为,这将帮助更多的人,而不仅仅是我. 解决方案 本地二级索引仍然依赖原始哈希键.当您提供带有 hash+range 的表时,请将 LSI 视为 hash+range1、hash+range2.. hash+range6.您还有 5 个范围属性可供查询.此外,只有一个预置吞吐量. 全局二级索引定义了一个新的范例 - ..
发布时间:2022-01-15 16:49:55 其他开发

Lucene 索引和搜索同时进行

我想在索引上使用 Lucene 进行搜索.索引经常更改.所以我需要做一些事情来同时搜索和索引.它是 Tomcat 上的 Web 应用程序.我想使用 RAMDeirectory 来提高搜索速度.我不知道该怎么做! 解决方案 misc Lucene 包中的NRTManager 提供同时搜索和索引的能力. TrackingIndexWriter 编写器;//你的作家SearcherFactor ..
发布时间:2022-01-15 13:23:30 Java开发

Elasticsearch:何时将 omit_norms 选项设置为 false

elasticsearch 中 omit_norms 选项的好用例是什么?我在 es 网站上找不到足够的解释. 解决方案 规范是存储在索引中与字段并列的值,用于评分.使用默认评分算法,这结合了 lengthNorm(用于对短字段进行比长字段更重的权重)和任何字段级别的提升.您可以在 Lucene 文档. LengthNorm 方面最有助于正确的全文字段.在不需要字段提升的结构化字段上 ..
发布时间:2022-01-15 13:21:17 其他开发

Lucene 上打开的文件太多错误

我正在进行的项目是索引一定数量的数据(带有长文本)并将它们与每个间隔(大约 15 到 30 分钟)的单词列表进行比较. 一段时间后,比如第 35 轮,在第 36 轮开始索引新数据集时出现此错误: [ERROR] (2011-06-01 10:08:59,169) org.demo.service.LuceneService.countDocsInIndex(?:?):countDocsI ..
发布时间:2022-01-15 13:20:09 服务器开发

如何使用 couchdb-lucene 在 CouchDB 中索引数组(标签)

设置: 我有一个使用 CouchDB 的项目.文档将有一个名为“标签"的字段.这个“tags"字段是一个字符串数组(例如,“tags":[“tag1",“tag2",“etc"]).我正在使用 couchdb-lucene 作为我的搜索提供程序. 问题: 用什么函数可以让couchdb-lucene对“tags"的元素进行索引? 如果你有想法但没有测试环境,打出来,我试试, ..
发布时间:2022-01-15 13:19:59 其他开发

“-"的 Lucene 索引问题特点

我在使用 Lucene 索引时遇到问题,该索引的索引词包含“-"字符. 它适用于某些包含“-"的单词,但不适用于所有单词,我找不到原因,为什么它不起作用. 我正在搜索的字段经过分析并包含带有和不带有“-"字符的单词的版本. 我正在使用分析器:org.apache.lucene.analysis.standard.StandardAnalyzer 这里是一个例子: 如果 ..
发布时间:2022-01-15 13:15:59 Java开发

一个lucene字段的store属性

有一个lucene Field的构造函数: Field(String name, String value, Store store, Index index) 例如,我可以通过以下方式创建一个新字段: Field f1 = new Field("text", "The text content", Field.Store.YES, Field.Index.ANALYZED); 我不太清楚 ..
发布时间:2022-01-15 13:11:52 其他开发

使用 Apache Lucene 索引 MySQL 数据库,并使它们保持同步

在 MySQL 中添加新项目时,它也必须被 Lucene 索引. 从 MySQL 中删除现有项目时,它也必须从 Lucene 的索引中删除. 我们的想法是编写一个脚本,该脚本将通过调度程序每 x 分钟调用一次(例如 CRON 任务).这是一种保持 MySQL 和 Lucene 同步的方法.到目前为止我所管理的: 对于 MySQL 中的每个新添加项,Lucene 也会对其进行索引. ..
发布时间:2022-01-15 13:11:23 Java开发