aggregate相关内容

计算数据帧中每秒的值的平均值

我想通过平均值聚合每两个单元格值,并在数据框的列下继续使用相同的过程。 要更准确地看到以下数据框提取: XYZ 1 FRI 200101010000 -6.72 2 FRI 200101010030 -6.30 3 FRI 200101010100 -6.26 4 FRI 200101010130 -5.82 5 FRI 200101010200 -5.64 6 ..
发布时间:2017-03-26 02:57:07 其他开发

R聚合在函数中有多个参数

通过在数据框架上使用聚合来避免使用循环的时间。但是我需要一个列的值进入最终计算。 dat rate = c(0.5,0.4,1,0.6), v1 = c(4,0,3 ,1), v2 = c(2,0,9,4)) > dat 密钥率v1 v2 1 a 0.5 4 2 2 b 0.4 0 0 3 a 1.0 3 9 4 b 0.6 1 4 aggregate( ..
发布时间:2017-03-26 02:38:02 其他开发

熊猫分组 - 作为分组总计的百分比的值不工作

使用数据框和大熊猫,我试图找出每个值是“group by”类别的总计的百分比。 所以使用提示数据库,我想看到,对于每个性别/吸烟者,总帐单的比例是女性吸烟者/所有女性和女性非吸烟者/所有女性(男性同样的) 例如, 如果完整的数据集是: 性别,吸烟者,日间,时间,大小,总帐单 女性,不,太阳,晚餐,2,20 女性,不,星期一,晚餐, 2,40 女,不,周三,晚餐,1,10 ..
发布时间:2017-03-26 02:24:12 Python

跨数据帧的所有行的平均列值

我有一个从这样的文件中读取的数据框: 名称,积分,胜利,损失,margin joe,1,1,0,1 bill,2,3,0,4 joe,5,2,5,-2 cindy, 2,3,-2.5 等。 我想在这个数据的所有行中平均列数值,在R中是否有一个简单的方法? 例如,我想得到所有“Joe”的平均列值出现如下: joe,3,1.5,2. ..
发布时间:2017-03-26 01:31:09 其他开发

R如何根据另一个变量的范围获得一个变量的平均值?

如果我有两个变量X和Y的一系列观察结果,那么如何根据变量X的范围来获取Y的平均值? 所以对于例如,使用一些数据,如: df = data.frame(x = runif(50,1,100),y = runif(50,300,700)) 我如何得到答案:“当X为平均值为X3.34时,当X为11-20平均值时的y为632.3等....“ 解决方案 使用 cut 然后在包 pl ..
发布时间:2017-03-26 01:24:50 其他开发

将分组的平均值添加到数据帧中的列

我想在数据框中计算组的方法,并在包含这些组平均值的原始数据框中创建一个新列。 (我正在做一个重复性研究,我想要在一个新的列中插入,单位和渠道中的测量值的平均值,所以我可以减去它并计算残差。) 我的资料: >头(mytestdata,15) 插入测量单位通道值 1 1 1 A5 10 9.41 2 1 1 A5 11 9.51 3 1 1 A5 12 10.59 4 1 1 ..
发布时间:2017-03-26 00:35:49 其他开发

使用较低级别组中的顶级组的聚合结果

我有2个表A {int id,int grp},B {int aid,int cat}。 表B包含表的记录A属于,所以B.aid是引用A.id的Foreign Key。 A.id是表A的唯一主键。 B.cat包含从1到5的类别编号,A.grp包含从1到1000的数字。 表A有300万记录,表B - 约5百万。 对于每个组A.grp,我需要计算A中包含B.cat的记录的 ..
发布时间:2017-03-19 01:52:10 其他数据库

如何使用data.frame或data.table长格式方法集成在多行上定义的属性

我最近开始使用data.table包中的R.我发现它超级方便的转换和聚合数据。我错过的一件事是,你如何变换在多行上定义的数据?我需要首先以大格式重新整形data.frame /表格吗? 假设您有以下数据表: dt = data.table(group = c(“a”,“a”,“a”,“b”,“b”,“b”), subg = c(“f1”,“f2”,“f3”,“f1”,“f2”,“f ..
发布时间:2017-03-12 13:15:12 其他开发

通过引用列名称在数据表中聚合

我想通过数据表中的列列来聚合一些列。但是,我想避免使用引号外的列名称(在 by =。(desiredColumn1,desiredColumn2),即)。我很高兴使用列名或列索引。例如: library(data.table) x = as.data.table(iris) x [,sum(Sepal.Width),by =。(Sepal.Length,Species)]#我想避免这样做 ..
发布时间:2017-03-12 12:56:07 其他开发

条件合并表

我有2张书: 时间X1 8/1/2013 56 9/1 / 2013 14 10/1/2013 8 11/1/2013 4 12/1/2013 78 时间X2 8/1 / 2013 42 9/1/2013 44 10/1/2013 2 11/1/2013 75 12/1/2013 36 如何通过“时间”合并这两个表在一个表分组中 ..
发布时间:2017-03-12 12:35:46 其他开发

使用dplyr包复制ddply? ddply太慢了

我使用一些大时间序列数据集,每个文件约有200万行。到目前为止,我一直使用ddply来聚合数据,像我想要的,但不幸的是,它已经变得太慢,我真的需要一个更快的方式。这是我的代码: DF DF options(digits.secs = 3) DF $ DateTime = as .POSIXct(DF $ DateTime /(10 ^ 9),origin =“1970-01-01”) ..
发布时间:2017-03-12 12:09:16 其他开发

基于另一行中的条件聚合数据表

我想基于两个条件聚合 data.table ,其中一个附加到另一行。这里是我的问题和一个可重复的例子: 我有一对起点目的地。 对于每个起点,我想对满足 condition1 的目的地的点数求和。 每个起点 - 目的地对中的点只能求和一次 只有在逆向通量中满足IF condition2 也就是说, AB 中的点只能在 condition1 == T 和如果有 BA pair其中 con ..
发布时间:2017-03-12 12:04:06 其他开发