approximate-nn-searching相关内容
我实际上是在处理高维数据(约50.000-100.000个特征),因此必须对其进行最近邻居搜索。我知道随着尺寸的增长,KD-Trees的性能会很差,而且我已经读到,一般来说,所有空间分区数据结构都倾向于对高维数据执行穷举搜索。 另外,还需要考虑两个重要事实(按相关性排序): 精度:必须找到最近的邻居(而不是近似值)。 速度:搜索速度必须与可能。 (创建数据结构的时间并不重要)。
..
我已经阅读了有关以下内容的原始论文本地敏感哈希. 复杂度取决于参数ε的函数,但我不知道它是什么. 您能解释一下它的意思吗? 解决方案 ε是近似参数. LSH(如法兰& 因此,我们专注于解决检查下面的图像: 在这里您看到找到精确/近似NN的含义.在传统的NNS(最近邻搜索)问题中,我们被要求找到确切的NN.在现代问题中,近似NNS要求我们在(1 +ε)半径内找到一些邻
..
我正在尝试了解 给出每个由d位组成的位向量,我们选择N = O(n 1/(1 + epsilon) )位的随机排列.对于每个随机排列σ,我们 保持字典向量的排序顺序Oσ(按字典顺序) σ置换的比特数.给定查询位向量q,我们发现 通过执行以下操作来近似最接近的邻居:对于每个permu- tσ,我们对Oσ进行二分查找以找到两个位 最接近q的向量(按位的字典序) 由σ排列).现在,我们按排序顺序搜索每
..
我试图解决的问题,在这个问题的解释: 我的问题是关于在这个问题页建议的解决方案部分。在这一部分它提到,我们找到了最近的邻居,从每个preFIX树遍历从节点开始的树。那么查找是否存在密钥在preFIX树很简单,但得到的最相似的一个我不明白,在所有。如何做到这一点? 我想,如果有人可以解释这对我来说,如果不是以图形方式(这是preferred),那么至少有一些细节。 编辑: 下面是本文的code
..
我有50万个点的数据库在100维空间,我想找到最接近的2分。我该怎么做呢? 更新:空间是欧几里德,对不起。并感谢所有的答案。顺便说一句,这不是功课。 解决方案 您可以尝试在 ANN库,但是仅给出了可靠的结果高达20的尺寸。
..