aggregate相关内容

三个表上的 SQL JOIN、GROUP BY 以获取总数

我继承了以下数据库设计.表是: 客户---------客户ID顾客号码发票--------发票编号数量发票付款---------------发票付款编号发票编号付款编号付款--------付款编号客户ID数量 我的查询需要返回给定客户编号的 invoiceid、发票金额(在发票表中)和应付金额(发票金额减去已针对发票支付的任何款项).一个客户可能有多张发票. 当对发票进行多次付款时,以下 ..
发布时间:2021-12-17 20:54:59 其他开发

如何获得具有多个字段的 Elasticsearch 聚合

我正在尝试查找与当前正在查看的标签相关的标签.我们索引中的每个文档都带有标签.每个标签由两部分组成 - ID 和文本名称: {...元:{...标签: [{编号:123,名称:'饼干'},{编号:456,名称:'蛋糕'},{编号:789,名称:'面包'}]}} 要获取相关标签,我只需查询文档并获取其标签的集合: {“询问": {“布尔":{“必须": [{“比赛": {“item.meta. ..
发布时间:2021-12-13 12:32:13 其他开发

Elasticsearch:可以处理聚合结果吗?

我使用 SUM-Aggregation 计算我的服务流程的持续时间.执行过程的每一步都将保存在 Elasticsearch 中的调用 Id 下. 这是我监控的: ID #123 的请求处理持续时间(调用服务 #1)ID #123 的服务器响应持续时间(调用服务 #1)**完成 ID #123 的持续时间**ID #124 的请求处理持续时间(调用服务 #1)ID #124 的服务器响应持续 ..
发布时间:2021-12-13 12:24:25 其他开发

Elasticsearch - 通用构面结构 - 结合过滤器计算聚合

在我们的一个新项目中,我们受到了这篇文章的启发 http://project-a.github.io/on-site-search-design-patterns-for-e-commerce/#generic-faceted-search用于制作我们的“facet"结构.虽然我已经让它在文章描述的范围内工作,但我在选择方面时遇到了让它工作的问题.我希望有人可以提供一些尝试的提示,这样我就不必再次 ..
发布时间:2021-12-13 12:02:06 其他开发

C# Linq Group By 在多列上

公共类 ConsolidatedChild{公共字符串学校{得到;放;}公共字符串朋友{得到;放;}公共字符串FavoriteColor { get;放;}公共列表孩子{得到;放;}}公开课儿童{公共字符串学校{得到;放;}公共字符串名称 { 获取;放;}公共字符串地址{获取;放;}公共字符串朋友{得到;放;}公共字符串妈妈{得到;放;}公共字符串FavoriteColor { get;放;}} ..
发布时间:2021-12-09 10:53:23 C#/.NET

做groupby时保留其他列

我在 Pandas 数据帧上使用 groupby 来删除所有没有特定列最小值的行.像这样: df1 = df.groupby("item", as_index=False)["diff"].min() 但是,如果我的列多于这两列,则其他列(例如,在我的示例中为 otherstuff)将被删除.我可以使用 groupby 保留这些列,还是必须找到不同的方法来删除行? 我的数据看起来像: ..
发布时间:2021-12-03 08:50:49 Python

折叠行,其中一些都是 NA,其他与一些 NA 不相交

我有一个简单的数据框: ID Col1 Col2 Col3 Col41 呐呐呐呐呐1 5 10 不适用 不适用1 不适用 不适用 15 202 呐呐呐呐呐2 25 30 不适用 不适用2 不适用 不适用 35 40 我想重新格式化它: ID Col1 Col2 Col3 Col41 5 10 15 202 25 30 35 40 (请注意:真实数据集有数千行,值来自生物数据——NA 没有遵 ..
发布时间:2021-12-01 21:16:46 其他开发

按组选择前 N 个值

这是对 r-help 邮件列表中提出的问题. 这里有很多的示例,说明如何找到顶部使用 sql 按组对值进行分组,所以我想通过使用 R sqldf 包很容易转换这些知识. 一个例子:当 mtcars 按 cyl 分组时,这里是 cyl 的每个不同值的前三个记录.请注意,在这种情况下不包括关系,但最好展示一些处理关系的不同方法. mpg cyl disp hp drat wt qsec ..
发布时间:2021-12-01 21:05:51 其他开发

有条件地应用函数

我有一个这样的数据框: 实验迭代结果A 1 30.0一个 2 23.0A 3 33.3乙 1 313.0乙 2 323.0B 3 350.0.... 有没有办法通过应用带有条件的函数来统计结果.在上面的示例中,该条件是特定实验的所有迭代. 结果总和 (30 + 23, + 33.3)B 结果总和 (313 + 323 + 350) 我正在考虑“应用"功能,但找不到让它工作的方法. 解 ..
发布时间:2021-12-01 21:03:16 其他开发

按多列分组并对其他多列求和

我有一个包含大约 200 列的数据框,其中我想按前 10 个左右的因素对表格进行分组,并对其余列求和. 我有我想要分组的所有列名的列表以及我想要聚合的所有列的列表. 我正在寻找的输出格式需要是具有相同列数的相同数据帧,只是组合在一起. 是否有使用包 data.table、plyr 或任何其他包的解决方案? 解决方案 data.table 方式是: DT[, lapply ..
发布时间:2021-12-01 20:34:03 其他开发

提取数据帧中每个组内的最大值

我有一个带有分组变量(“Gene")和一个值变量(“Value")的数据框: 基因值一个 12一个 10乙 3乙 5乙 61D 34 对于我的分组变量的每个级别,我希望提取最大值.因此,结果应该是一个数据框,分组变量的每一级都有一行: 基因值一个 12乙 614 aggregate 可以解决问题吗? 解决方案 在 R 中有很多可能性可以做到这一点.以下是其中一些: df % gr ..
发布时间:2021-12-01 20:29:07 其他开发

用dplyr总结多列?

我在 dplyr 语法上有点挣扎.我有一个包含不同变量和一个分组变量的数据框.现在我想使用 R 中的 dplyr 计算每组中每一列的平均值. df % group_by(grp) %>% summarise(mean(a)) 这给了我“grp"表示的每个组的“a"列的平均值. 我的问题是:是否有可能一次获得每个组中每一列的平均值?或者我必须为每一列重复 df %>% group_by(g ..
发布时间:2021-12-01 20:27:27 其他开发

按组提取变量最小值对应的行

我希望(1)按一个变量(State)对数据进行分组,(2)在每个组内找到另一个变量(Employees)的最小值行, 和 (3) 提取整行. (1) 和 (2) 是简单的单行,我觉得 (3) 也应该是,但我不明白. 这是一个示例数据集: >数据国营公司员工1 AK A 822 AK B 1043 AK C 374 AK D 245 RI E 196 RI F 1187 RI G 88 ..
发布时间:2021-12-01 20:27:17 其他开发

在一次调用中按组对多个变量应用多个汇总函数

我有以下数据框 x 我想计算id1和id2分组的val1和val2的均值,同时计算每个id1-id2组合的行数.我可以单独执行每个计算: # 计算平均值聚合(.〜id1 + id2,数据= x,乐趣=平均值)# 计算行数聚合(.〜id1 + id2,数据= x,乐趣=长度) 为了在一次调用中进行两种计算,我尝试了 do.call("rbind",aggregate(.~id1 + id ..
发布时间:2021-12-01 20:26:39 其他开发

计算每组的行数并将结果添加到原始数据框中

假设我有一个 data.frame 对象: df 现在我想计算 name 和 type 的每个组合的行数(观察值).可以这样做: table(df[, c("name","type")]) 或者也可能使用 plyr,(虽然我不确定如何). 但是,如何将结果合并到原始数据框中?使结果看起来像这样: df# 名称类型 num 计数# 1 黑色椅子 4 2# 2 黑色椅子 5 2# 3 ..
发布时间:2021-12-01 20:25:37 其他开发

按唯一标识符聚合并将相关值连接成字符串

我有一个我认为可以通过 aggregate 或 reshape 来满足的需求,但我不太清楚. 我有一个名称列表(brand)和随附的 ID 号(id).此数据为长格式,因此名称可以有多个 ID.我想按名称 (brand) 去除重复并将多个可能的 id 连接成一个由注释分隔的字符串. 例如: 品牌标识RadioShack 2308破布&骨4466抹布1830抹布4518拉尔夫劳伦 16 ..
发布时间:2021-12-01 20:25:02 其他开发