dataframe相关内容

基于另一行中的条件聚合数据表

我想基于两个条件聚合 data.table ,其中一个附加到另一行。这里是我的问题和一个可重复的例子: 我有一对起点目的地。 对于每个起点,我想对满足 condition1 的目的地的点数求和。 每个起点 - 目的地对中的点只能求和一次 只有在逆向通量中满足IF condition2 也就是说, AB 中的点只能在 condition1 == T 和如果有 BA pair其中 con ..
发布时间:2017-03-12 12:04:06 其他开发

基准数据框架(基准),数据框架(包数据框架)和数据表格

随着最近推出的包 dataframe ,我认为是时候正确地对各种数据结构进行基准测试,并突出显示每个数据结构是最好的。我不是每个人的不同优势的专家,所以我的问题是,我们应该如何对他们进行基准化。 我试过的一些(相当粗糙的) library(microbenchmark) library(data.table) mat ..
发布时间:2017-03-12 12:02:23 其他开发

我如何重新列表的列表从广泛到长

我有一个具有共同结构的列表列表 require(data.table) l a2 = list b = data.table(rnorm(3)),c = data.table(rnorm(3)),d = data.table(rnorm(3)))) pre> 有时, lapply 更容易将结构从2x3列表更改为3x2列表: + a1 --- b + b --- a ..
发布时间:2017-03-12 12:01:02 其他开发

使用data.table加快rollapply

我是新的data.tables如此抱歉,如果这是一个非常基本的问题。 我听说data.tables在处理大量数据时显着提高了计算时间,所以想看看data.table是否能够帮助加快滚动功能。 如果我们有一些单变量数据 xts.obj ..
发布时间:2017-03-12 11:41:25 其他开发

过去21天中的每个行的事件按名称

这是我的数据框看起来像。两个最右边的列是我所需的列。这两列检查条件是否在最近21天有一个“电子邮件”ActivityType,以及在最近21天是否有一个“网络研讨会”ActivityType。 姓名ActivityType ActivityDate电子邮件(last21days)网络研讨会(last21day)** John电子邮件1/1/2014 TRUE NA John Webi ..
发布时间:2017-03-12 11:33:59 其他开发

确定data.frame的列何时更改值和更改的返回索引

我试图找到一种方法来确定一组列在数据框架中何时更改值。让我直截了当,请考虑以下示例: x x [4, = 6 cnt列是唯一的ID ,或时间列,为了简单起见,这里是一个int) 代码列就像一组行的代码(想象几个这样的组,但是具有不同的代码)。 val0,val1,val2列就像是分数。 上面的data.frame应该被理解为:'ELEM ..
发布时间:2017-03-12 11:30:37 其他开发

在Excel中快速查看R data.frame,vector或data.table

如何在Excel中快速打开小的R表/向量对象? 例如,假设您想在Excel中查看以下三个对象: / p> ##带有逗号和引号的数据框 df = data.frame( area = unname state.x77 [,'Area']), frost = unname(state.x77 [,'Frost']), comments =“确定访问,但不想住在那里“, chal ..
发布时间:2017-03-12 11:29:23 其他开发

R:将JSON通用扁平化为data.frame

这个问题是关于将非循环同构或异构数据结构的任何集合转换为数据帧的通用机制。这在处理许多JSON文档的获取或者是一个字典数组的大型JSON文档时特别有用。 有几个SO问题处理使用 plyr , lapply 等功能操纵深层嵌套的JSON结构并将其转换为数据框架。所有问题和答案我发现有关具体情况,而不是提供一个通用的方法来处理复杂的JSON数据结构的集合。 在Python和Ruby中,我通 ..
发布时间:2017-03-12 11:25:53 其他开发

重命名R中的一个命名列

我想更新数据框架的一列,使用其原始名称来引用它,这是否可能?例如,我有表'data' abc 1 2 2 3 2 3 4 1 2 ,我想将列b的名称更新为'd'。我知道我可以使用 colnames(data)[2] ..
发布时间:2017-03-12 11:24:26 其他开发

R:通过引用传递数据帧

R具有pass-by-value语义,可以最大限度地减少意外的副作用(一件好事)。然而,当代码被组织成用于可重用性/可读性/可维护性的许多函数/方法时,并且当该代码需要通过例如大数据帧来操纵大型数据结构时,通过一系列变换/操作,pass-by-value语义导致到大量的数据复制和堆栈颠簸(一个坏东西)。例如,作为函数参数传递的在堆上占用50Mb的数据帧将以函数调用深度的最小相同次数进行复制,并且调 ..
发布时间:2017-03-12 11:23:16 其他开发

是否可以在原地(破坏性地)修改data.frame?

似乎可以在 data.table 中就地添加/删除列,即而不复制将所有其他列转移到新表中。 可以使用一个 data.frame ? PS。我知道如何添加/删除列“功能”,即创建一个新的框架,而不修改原始的。 解决方案 可以通过 data.table :: set 的引用从 data.frame 中删除​​或修改现有列。我怀疑你可以添加一个列而不复制。可以向 data.table ..
发布时间:2017-03-12 11:22:17 其他开发

从1个数据帧中的多个时间序列的开始和结束有效地删除缺失值

使用R,我试图修剪包含多个时间序列的数据帧的开始和结束处的NA值。我已经实现了我的目标使用一个for循环和动物园包,但正如预期的,对大型数据框是非常低效的。 我的数据框看起来像这样,包含3列,每个时间序列由其唯一ID标识。在这种情况下为AAA,B和CCC。 id日期值 AAA 2010/01/01 NA AAA 2010/02/01 34 AAA 2010/03/01 35 ..
发布时间:2017-03-12 10:53:15 其他开发