approximate-nn-searching相关内容

高维最近邻居搜索的最佳数据结构

我实际上是在处理高维数据(约50.000-100.000个特征),因此必须对其进行最近邻居搜索。我知道随着尺寸的增长,KD-Trees的性能会很差,而且我已经读到,一般来说,所有空间分区数据结构都倾向于对高维数据执行穷举搜索。 另外,还需要考虑两个重要事实(按相关性排序): 精度:必须找到最近的邻居(而不是近似值)。 速度:搜索速度必须与可能。 (创建数据结构的时间并不重要)。 ..

局部敏感哈希(LSH)中的ε(ε)参数是什么?

我已经阅读了有关以下内容的原始论文本地敏感哈希. 复杂度取决于参数ε的函数,但我不知道它是什么. 您能解释一下它的意思吗? 解决方案 ε是近似参数. LSH(如法兰& 因此,我们专注于解决检查下面的图像: 在这里您看到找到精确/近似NN的含义.在传统的NNS(最近邻搜索)问题中,我们被要求找到确切的NN.在现代问题中,近似NNS要求我们在(1 +ε)半径内找到一些邻 ..

搜索位置敏感的哈希

我正在尝试了解 给出每个由d位组成的位向量,我们选择N = O(n 1/(1 + epsilon) )位的随机排列.对于每个随机排列σ,我们 保持字典向量的排序顺序Oσ(按字典顺序) σ置换的比特数.给定查询位向量q,我们发现 通过执行以下操作来近似最接近的邻居:对于每个permu- tσ,我们对Oσ进行二分查找以找到两个位 最接近q的向量(按位的字典序) 由σ排列).现在,我们按排序顺序搜索每 ..

如何查找在preFIX树NN-搜索最相似的位向量?

我试图解决的问题,在这个问题的解释: 我的问题是关于在这个问题页建议的解决方案部分。在这一部分它提到,我们找到了最近的邻居,从每个preFIX树遍历从节点开始的树。那么查找是否存在密钥在preFIX树很简单,但得到的最相似的一个我不明白,在所有。如何做到这一点? 我想,如果有人可以解释这对我来说,如果不是以图形方式(这是preferred),那么至少有一些细节。 编辑: 下面是本文的code ..