hamming-distance相关内容

多序列的汉明距离矩阵

我有一个包含ID和相应DNA序列的FASTA文件,我已将其解析并存储到词典中。 我现在需要编写一个Python程序来计算所有序列的成对汉明距离矩阵。 到目前为止,我已经尝试对词典的所有值运行for循环并检查每个字符,但这不能正确实现汉明距离或返回矩阵。 推荐答案 尝试使用Skledge包,它有一个函数来计算指定距离度量的成对距离。您可以在此处找到该函数:https://sciki ..
发布时间:2022-04-15 12:47:21 Python

数据库中的汉明距离/相似性搜索

我有一个过程,类似于 tineye 生成感知散列,这些是 32 位整数. 我打算将来将这些存储在 sql 数据库(可能是 nosql db)中 然而,我对如何根据哈希的相似性检索记录感到困惑. 有什么想法吗? 解决方案 一个常见的方法(至少对我来说是常见的)是将你的哈希位串分成几个块,然后查询这些块以获得精确匹配.这是一个“预过滤"步骤.然后,您可以对返回的结果执行按位汉 ..
发布时间:2021-12-20 14:05:50 其他开发

生成汉明距离 t 内的所有位序列

给定一个比特向量v,计算具有v的汉明距离为1的比特集合,then,距离为2,向上到输入参数 t. 所以 011 我应该得到~~~111001010~~~ ->3 选1101000110~~~ ->3选2100~~~ ->3 选择 3 如何有效地计算这个?向量不会总是 3 维,例如它可能是 6.这将在我的实际代码中运行很多次,因此也欢迎提高效率(即使支付更多内存). 我的尝试: # ..

Elasticsearch中通过pHash距离搜索相似图片

类似图片搜索问题 数以百万计的图像经过pHash处理并存储在 Elasticsearch 中. 格式为“11001101...11"(长度为 64),但可以更改(最好不要). 给定主题图像的哈希“100111..10",我们希望在 Elasticsearch 索引中找到所有相似的图像哈希汉明距离为 8. 当然,query 可以返回距离大于 8 的图片,Elasticsearch ..
发布时间:2021-12-13 11:46:53 其他开发

在大集合中有效地找到具有低汉明距离的二进制字符串

问题: 给定一个大型(约 1 亿)无符号 32 位整数列表、一个无符号 32 位整数输入值和一个最大值 汉明距离,返回输入值指定汉明距离内的所有列表成员. 保存列表的实际数据结构是开放的,性能要求决定了内存中的解决方案,构建数据结构的成本是次要的,查询数据结构的低成本至关重要. 示例: 最大汉明距离为 1(值通常会非常小)并输入:000010001000000000000000 ..

SQL中二进制字符串的汉明距离

我的数据库中有一个表,我将 SHA256 哈希值存储在 BINARY(32) 列中.我正在寻找一种方法来计算列中条目与提供的值的汉明距离,即: SELECT * FROM 表ORDER BY HAMMINGDISTANCE(hash, UNHEX()) ASC限制 10 (如果您想知道,字符串 A 和 B 的汉明距离定义为 BIT_COUNT(A^B ..
发布时间:2021-11-20 22:49:07 数据库

计算两个整数矩阵/数据帧的所有行之间的成对汉明距离

我有两个数据框,带有参考数据的 df1 和带有新数据的 df2.对于 df2 中的每一行,我需要根据汉明距离找到与 df1 匹配的最佳(和次佳)行. 我使用 e1071 包来计算汉明距离.两个向量 x 和 y 之间的汉明距离可以计算为例如: x 结果距离为 25.但我需要对 df1 和 df2 的所有行执行此操作.一个简单的方法需要一个双循环嵌套,看起来非常慢. 任何想法如何更有 ..
发布时间:2021-11-16 23:04:43 其他开发

Python中两个字符串之间的汉明距离

我是 Python 新手,我需要找到两个字符串之间的汉明距离: chaine1 = 6fb17381822a6ca9b02153d031d5d3dachaine2 = a242eace2c57f7a16e8e872ed2f2287d XOR 功能没用,我在网上搜索也不是很成功. 我试图修改我在网上找到的东西,但有一些无效的语法...: assert len (chaine1) == l ..
发布时间:2021-10-02 19:06:41 Python

查找字符串序列之间的汉明距离

我有一个3156个DNA序列的数据集,每个序列都有98290个字符(SNP),包括(通常)5个符号: A,C,G,T,N (缺口). 找到这些序列之间的成对汉明距离的最佳方法是什么? 请注意,对于每个序列,我实际上想查找序列数量(包括其自身)的倒数,其中每个站点的汉明距离小于某个阈值(在此示例中为0.1). 到目前为止,我已经尝试了以下操作: library(doParal ..
发布时间:2020-06-17 19:22:54 其他开发

Python-如何生成成对汉明距离矩阵

Python的入门者.所以我在尝试仅使用numpy库来计算输入矩阵的行之间的二进制成对汉明顿距离矩阵时遇到了麻烦.我应该避免循环并使用向量化.例如,如果我有类似的东西: [ 1, 0, 0, 1, 1, 0] [ 1, 0, 0, 0, 0, 0] [ 1, 1, 1, 1, 0, 0] 矩阵应类似于: [ 0, 2, 3] ..
发布时间:2020-06-17 19:22:52 Python

计算方格的汉明距离和重量

是否有一种很好的方法来计算sqlite中的汉明距离和重量?它支持按位运算符,但我想根据汉明权重对结果进行排序,并且在sqlite中不支持位计数. 更详细地说,假设我有这些行: 1011 1000 1100 0011 并给出第一行(1011)的结果,我想得到的最后一行(0011)如果与它们相加,则得出的数字最多. 在我的情况下,数字的长度约为650位,我大约有3500行. 我已经找 ..
发布时间:2020-06-17 19:22:48 数据库

检查CRC多项式的错误检测能力

我试图找出如何计算任意CRC多项式的错误检测能力. 我知道有多种错误检测功能可能(也可能不会)适用于任意多项式: 单个位的检测错误: 所有的CRC都可以这样做,因为这只需要CRC宽度> = 1. 突发错误的检测: 所有CRC都可以检测到突发错误,大小不超过其宽度. 奇数个比特错误的检测: 带有多项式为偶数项的CRC(这意味着在完整的二进制多项式中偶数为1位)可以做到这一点. ..

汉明距离是多少?对于CRC方案如何确定?

在学习计算机网络课程时,教授谈到了示例代码中2个有效代码字之间的汉明距离.我已经阅读了汉明距离,从告诉2根弦之间的距离差异的角度来看,这很有道理.例如: Code Word 1 = 10110 发送方发送代码字1,并且引入了一个错误,接收方接收到10100.因此,您看到第4位已损坏.汉明距离为1,因为: Valid Code Word: 10110 Error Code Word ..
发布时间:2020-06-17 19:22:40 其他开发

计算两个描述符之间的距离

我正在尝试计算已经计算的两个描述符之间的距离(欧几里得或海明).问题是我不想使用匹配器,我只想计算两个描述符之间的距离. 我使用的是OpenCV 2.4.9,并且在Mat类型中存储了我的描述符: Mat descriptors1; Mat descriptors2; 现在我只想计算描述符1的row1和描述符2的row1之间的距离(最好是汉明距离,因为我使用的是二进制描述符). 我 ..

快速汉明距离得分

有一个具有N个固定长度字符串的数据库. 有一个相同长度的查询字符串. 问题是要从数据库中提取距k的汉明距离最短的前k个字符串. N小(大约400),弦长,长度固定.数据库不会更改,因此我们可以预先计算索引.查询差异很大,无法选择缓存和/或预先计算.每秒有很多.即使k-1个结果匹配为0,我们也总是需要k个结果(按汉明距离排序并取第一个k,因此对位置敏感的哈希和类似方法将不起作用). kd-tr ..
发布时间:2020-06-17 19:22:28 其他开发

计算红宝石中汉明距离的最有效方法?

在ruby中,计算两个无符号整数(例如汉明距离)之间的位差的最有效方法是什么? 例如,我有整数a = 2323409845和b =178264714​​4. 它们的二进制表示形式是: a = 10001010011111000110101110110101 b = 01101010010000010000100101101000 a&之间的位差b是17 .. 我可以对它 ..
发布时间:2020-06-17 19:22:26 其他开发