aggregate相关内容
我正在尝试获取两个变量“周"和“id"的每个级别组合的计数.我希望结果将“id"作为行,“week"作为列,并将计数作为值. 到目前为止我尝试过的示例(尝试了很多其他事情,包括添加一个虚拟变量 = 1,然后在其上添加 fun.aggregate = sum): 库(plyr)ddply(data, .(id), dcast, id ~ week, value_var = "id",fun.
..
我有一个 data.frame,我需要计算每个组的平均值(即每个 Month,如下). 名称 月率1 率2艾拉 1 12 23艾拉 2 18 73艾拉 3 19 45本 1 53 19本 2 22 87本 3 19 45猫 1 22 87猫 2 67 43猫 3 45 32 我想要的输出如下所示,其中 Rate1 和 Rate2 的值是组均值.请忽略该值,我已经为示例补上了. 名称 Rate
..
我想根据两个分组变量聚合数据框中的一列,并用逗号分隔各个值. 这是一些数据: data “A"和“B"是分组变量,“C"是我想折叠成逗号分隔的character字符串的变量.我试过了: 库(plyr)ddply(数据,.(A,B),总结,测试=列表(C))A B 测试1 111 1 5, 72 111 2 63 222 1 94 222 2 8, 10 但是当我尝试将测试列转换为
..
从一个数据框中,是否有一种简单的方法可以同时聚合(sum、mean、max 等)多个变量? 以下是一些示例数据: library(lubridate)天数 = 365*2date = seq(as.Date("2000-01-01"), length = days, by = "day")年 = 年(日期)月 = 月(日期)x1 = cumsum(rnorm(days, 0.05))x2
..
我正在尝试在 SQLServer 中聚合一个“STRING"字段.我想在 Oracle 中找到与 LISTAGG 相同的函数. 你知道如何做同样的功能或另一种方法吗? 例如 字段 A |B场1 |一种1 |乙2 |一种 我希望这个查询的结果是 1 |AB2 |一种 解决方案 从 SQL Server 2017 STRING_AGG 函数可用,大大简化了逻辑: 选择 Fiel
..
此常见问题解答是关于聚合和 POD 的,涵盖以下材料: 什么是聚合? 什么是POD(普通旧数据)? 它们有什么关系? 它们有何特别之处?为何如此? C++11 有哪些变化? 解决方案 阅读方法: 这篇文章比较长.如果您想了解聚合和 POD(普通旧数据),请花点时间阅读它.如果您只对聚合感兴趣,请仅阅读第一部分.如果您只对 POD 感兴趣,那么您必须首先阅读聚合的定义、含
..
我有一个熊猫数据框 df 像: a b1A2乙 5乙 5乙 4C 6 我想按第一列分组并将第二列作为行中的列表: A [1,2]乙 [5,5,4]C [6] 是否可以使用 pandas groupby 来做这样的事情? 解决方案 您可以使用 groupby 对感兴趣的列进行分组,然后 apply 列出到每个组: In [1]: df = pd.DataFrame( {'a':['
..
我正在使用这个数据框: 水果日期名称编号苹果 10/6/2016 鲍勃 7苹果 10/6/2016 鲍勃 8苹果 10/6/2016 迈克 9苹果 10/7/2016 史蒂夫 10苹果 10/7/2016 鲍勃 1橘子 10/7/2016 鲍勃 2橘子 10/6/2016 汤姆 15橘子 10/6/2016 迈克 57橙子 10/6/2016 鲍勃 65橙子 10/7/2016 托尼 1葡萄 1
..
请注意,这个问题不是关于如何更改下面的代码以使其工作;相反,我正在寻找有关为什么编译器会发现此分配不明确的一些见解: entity assignment_to_aggregates 是结尾;assignment_to_aggregates 的架构示例是类型元音类型是 (a, e, i, o, u);类型辅音类型是 (b, c, d, f, g);类型元音辅音对是记录元音:元音类型;辅音:cons
..
相当典型的任务,但我坚持以漂亮的方式完成它. 例如,我需要找到每个供应商的最后一次发货,即找到每个供应商的最大日期的交货 供应商交货日期10 00055 01/01/201920 00070 01/19/201920 00088 01/20/201920 00120 11/22/201940 00150 04/01/201940 00200 04/10/2019 要填充的结果表 供应商
..
所以,我在下面给出了这些数据,我的目标是根据列 v1 和 v2 聚合列 v3,并为 v1 和 v2 的每个 bin 添加 v3 值.例如,第一行对应区间 v1=21, v2=16,因此 v3 的值将在其 (v1,v2) 区间上聚合.并对其余行重复此操作.我想用均值作为聚合函数! >dfv1 v2 v31 21.359 16.234 24.2832 47.340 9.184 21.3283 35.
..
相当典型的任务,但我坚持以漂亮的方式完成它. 例如,我需要找到每个供应商的最后一次发货,即找到每个供应商的最大日期的交货 供应商交货日期10 00055 01/01/201920 00070 01/19/201920 00088 01/20/201920 00120 11/22/201940 00150 04/01/201940 00200 04/10/2019 要填充的结果表 供应商
..
所以,我在下面给出了这些数据,我的目标是根据列 v1 和 v2 聚合列 v3,并为 v1 和 v2 的每个 bin 添加 v3 值.例如,第一行对应区间 v1=21, v2=16,因此 v3 的值将在其 (v1,v2) 区间上聚合.并对其余行重复此操作.我想用均值作为聚合函数! >dfv1 v2 v31 21.359 16.234 24.2832 47.340 9.184 21.3283 35.
..
如果我运行一个查询,例如: SELECT COUNT(*) as num FROM table WHERE x = 'y' 它是否总是返回结果,即使查询不匹配任何记录?或者我是否需要验证并确保返回一行作为结果? 解决方案 是的,因为它是一个聚合并返回零.除非您添加 GROUP BY 在这种情况下没有结果,因为没有组... MAX/SUM 等将返回 NULL,除非您添加 GROUP
..
基本上问题是如何从中获得: foo_id foo_name1 安1 乙2 C 为此: foo_id foo_name1 甲乙2 C 解决方案 SELECT id, GROUP_CONCAT(name SEPARATOR ' ') FROM table GROUP BY id; https://dev.mysql.com/doc/refman/8.0/en/aggregate-f
..
我想计算大于 0 的电子表格(特别是 Google 表格)中每一行的最小值的最大值.我希望这是有道理的.我的数据是: 0 6 7 8 10 12 21 22 210 10 18 240 7 9 1 170 16 16 20 所以,我想要一个可以生成的 ArrayFormula: 11210116 然后我可以获得最大值.我已经阅读并体验到明显的解决方案不起作用,即: =max(Array
..
我想计算大于 0 的电子表格(特别是 Google 表格)中每一行的最小值的最大值.我希望这是有道理的.我的数据是: 0 6 7 8 10 12 21 22 210 10 18 240 7 9 1 170 16 16 20 所以,我想要一个可以生成的 ArrayFormula: 11210116 然后我可以获得最大值.我已经阅读并体验到明显的解决方案不起作用,即: =max(Array
..
您好,我一直在琢磨一个新项目的想法,想知道是否有人知道像 Kayak.com 这样的服务如何能够如此快速、准确地聚合来自这么多来源的数据.更具体地说,您认为 Kayak.com 是在与 API 交互还是在抓取/抓取航空公司和酒店网站以满足用户请求?我知道这类事情没有一个正确的答案,但我很想知道其他人认为什么是解决这个问题的好方法.如果有帮助,假设您明天要创建 kayak.com ......您的数
..
我有一张桌子: X1 X2 X3Y1 10 12 15Y2 45 5 23Y3 12 47 56 我如何为每一行计算总和并在每个值附近写出该总和的百分比.例如:X1% X2% X3% Y1 10 27% 12 32% 15 40.5%Y2 45 .. 5 .. 23 ..Y3 12 .. 47 .. 56 .. 解决方案 你可以使用.如果 dat 是数据集(dat 在这个例子中是 da
..
我希望将函数应用于数据框,然后将该函数的结果存储在数据框的新列中. 这是我的数据框tradeData的示例: 登录 AL Diff1 01 01 00 10 00 00 01 -11 00 11 -11 00 11 00 10 00 0乙 1 -11 01 00 10 01 -1 其中“差异"列是我要添加的列.它只是 tradeData 的 row(x-1) 和 row(x) 值之间的差
..