indexing相关内容

PostgreSQL:索引时间戳的日期部分

考虑下表: 列|类型| -------------------- + ------------------------- - + id | bigint | creation_time |时间戳与时区| ... 如下所示的查询(更不用说更复杂的JOIN)同时,因为他们需要为每个项目计算creation_time :: DATE: SELECT c ..
发布时间:2017-04-06 23:29:40 其他开发

具有快速插入的矩形的空间索引

我正在寻找一个提供矩形索引的数据结构。我需要插入算法尽可能快,因为矩形将围绕屏幕移动(想想用鼠标拖动一个矩形到一个新的位置)。 我已经研究了R-Trees,R + Tree,kD-Trees,Quad-Trees和B-Trees,但是从我的理解插入中通常很慢。我更喜欢在亚线性时间复杂性中插入插页,所以也许有人可以证明我对任何列出的数据结构都是错误的。 我应该可以查询数据结构为什么矩形在 ..
发布时间:2017-04-03 15:06:27 其他开发

如何在Jva中实现n:m关系?

我需要在Java中实现一个n:m关系。 用例是一个目录。 一个产品可以分为多个类别 一个类别可以容纳多个产品 经典... 我目前的解决方案是具有两个hashmaps的映射类。 第一个hashmap的关键是产品ID,值为类别ID列表 第二个hashmap的关键是类别ID,值是产品ID列表 这是完全冗余的,我需要一个设置类,始终关心数据在两个hashmaps中的存储 ..
发布时间:2017-04-03 15:01:46 Java开发

自索引(和传统索引)算法 - 实现和建议分享​​?

作为研究项目的一部分,我正在寻找自索引算法的开放源代码实现,即传统的反向索引的压缩形式,产生了很好的特性,如更快的查找和/或更少的占用空间。 p> 你知道自索引算法的任何开源实现吗?您有其他有趣的索引算法或数据结构要分享吗? 欢迎所有语言和许可证变体。 解决方案 这是一个很好的介绍性介绍自我索引(PDF)。 ..

地理坐标的空间索引?

什么样的数据结构可以用于大量地理坐标中的有效最近邻搜索?使用假定平面坐标的“常规”空间索引结构,如R-Trees,我看到两个问题(有没有其他人忽视?): 绕线和国际日期线 极点附近的距离失真 这些因素如何被允许?我猜第二个可以通过改变坐标进行补偿。可以修改R树以考虑到环绕吗?还是有专门的地理空间索引结构? 解决方案 看看 Geohash 。 另外,为了补偿环绕,只需使用 ..
发布时间:2017-04-03 13:23:19 其他开发

最优秀的索引数据结构非常大的时间序列

我想问SO'ers的同事们关于最好的品种数据结构的意见,用于索引时间序列(又名列数据,又称平线性)。 基于抽样/离散特征,存在两种基本类型的时间序列: 定期离散化(每个样本都以普通频率拍摄) 不规则离散化(样本在任意时间点进行) 需要的查询: 所有值在时间范围[t0,t1] 时间范围[t0,t1]中的值大于/小于v0 在值范围[v0,v1] 数据集由 ..
发布时间:2017-04-03 12:53:33 C/C++开发

如何存储经常在DB中更改位置的有序物品

我需要能够在DB中存储大量有序项目。到目前为止,这是直截了当的: ID位置OtherFields 1 45 ... 2 4736。 .. 3 514 ... ... 在查询中,我总是需要得到一些项目(基于OtherFields进行过滤),但是顺序正确。 现在问题:项目经常改变他们的位置,并且不仅仅是1或2.如果ID 2将位置从4736更改为2 ..
发布时间:2017-04-03 11:55:13 其他开发

python大熊猫数据框 - 无法弄清楚如何查找从df给出值的索引

我有2个数据数据数据。给定第二个df中的一个列的值,我想查找第一个df中的值的索引。更具体地说,我想创建一个第三个df,它只包含索引标签 - 使用第二个值从第一个查找其坐标。 listso = [[21,101],[22,110],[25,113],[24,112],[21,109],[28,108],[30,102],[26,106],[25,111],[24,110]] data ..
发布时间:2017-03-26 04:18:30 Python

选择R中数据帧的最后n列

有没有办法系统地选择数据框架的最后一列?我希望能够将最后一列移动到第一列,但在移动列时保持列的顺序。我需要一种方式来执行此操作,而不是使用子集(数据,select = c(新订单中列出的所有列))列出所有列,因为我将使用许多不同的数据帧。 这里有一个例子,我想将最后2列移动到数据框的前面。它的作品,但它是丑陋的。 A = rep(“A”,5) B = rep(“B”,5) num ..
发布时间:2017-03-26 01:56:32 其他开发

基于“行”的过滤在python大熊猫中创建数据透视表后的数据

我有一组数据,我从一个SQL数据库中获取并读入一个熊猫数据框。结果df是大约250M行,每天都在增长。因此,我想转动桌子给我一个更小的桌子(几千行)。 该表看起来像这样,但更大: 数据 report_date item_id视图类别 0 2013-06-01 2 3 a 1 2013-06-01 2 2 b 2 2013-06-01 5 16 a 3 2013-06 ..
发布时间:2017-03-26 01:17:33 Python

在R中使用NA值组合删除行的高效方法

背景 在运行逐步模型选择之前,我需要删除我的任何模型项的缺失值。在我的模型中有相当多的术语,因此,我需要查找NA值(并删除任何这些向量中具有NA值的任何行)的相当多的向量。但是,还有一些向量包含不想用作删除行的条款/标准的NA值。 问题 如何从包含任何矢量列表的NA值的数据帧中删除行?我目前正在使用一系列长的系列的笨重方法!is.na的 > my.df [!is.na(my.df ..
发布时间:2017-03-26 01:11:43 其他开发