aggregate 第5页 - IT屋-程序员软件开发技术分享社区

在矩阵中按组(行名称)对列求和

假设我有一个名为 x 的矩阵. x ..

发布时间：2021-12-19 08:21:21 r matrix sum aggregate 其他开发

三个表上的 SQL JOIN、GROUP BY 以获取总数

我继承了以下数据库设计.表是: 客户---------客户ID顾客号码发票--------发票编号数量发票付款---------------发票付款编号发票编号付款编号付款--------付款编号客户ID数量我的查询需要返回给定客户编号的 invoiceid、发票金额(在发票表中)和应付金额(发票金额减去已针对发票支付的任何款项).一个客户可能有多张发票. 当对发票进行多次付款时，以下 ..

发布时间：2021-12-17 20:54:59 sql join aggregate 其他开发

我正在尝试查找与当前正在查看的标签相关的标签.我们索引中的每个文档都带有标签.每个标签由两部分组成 - ID 和文本名称: {...元:{...标签: [{编号:123，名称:'饼干'},{编号:456，名称:'蛋糕'},{编号:789，名称:'面包'}]}} 要获取相关标签，我只需查询文档并获取其标签的集合: {“询问": {“布尔":{“必须": [{“比赛": {“item.meta. ..

发布时间：2021-12-13 12:32:13 elasticsearch aggregate faceted-search 其他开发

Elasticsearch:可以处理聚合结果吗?

我使用 SUM-Aggregation 计算我的服务流程的持续时间.执行过程的每一步都将保存在 Elasticsearch 中的调用 Id 下. 这是我监控的: ID #123 的请求处理持续时间(调用服务 #1)ID #123 的服务器响应持续时间(调用服务 #1)**完成 ID #123 的持续时间**ID #124 的请求处理持续时间(调用服务 #1)ID #124 的服务器响应持续 ..

发布时间：2021-12-13 12:24:25 elasticsearch aggregate summarization 其他开发

Elasticsearch - 通用构面结构 - 结合过滤器计算聚合

在我们的一个新项目中，我们受到了这篇文章的启发 http://project-a.github.io/on-site-search-design-patterns-for-e-commerce/#generic-faceted-search用于制作我们的“facet"结构.虽然我已经让它在文章描述的范围内工作，但我在选择方面时遇到了让它工作的问题.我希望有人可以提供一些尝试的提示，这样我就不必再次 ..

发布时间：2021-12-13 12:02:06 elasticsearch aggregate facet 其他开发

Linq to Objects - 从数字列表中返回数字对

var nums = new[]{ 1, 2, 3, 4, 5, 6, 7};var pair =/* 这里有一些 linq 魔法 */; =>对 = { {1, 2}, {3, 4}, {5, 6}, {7, 0} } pairs 的元素应该是双元素列表，或者是一些具有两个字段的匿名类的实例，例如 new {First = 1, Second = 2}. 解决方案没有任何默认的 ..

发布时间：2021-12-09 11:41:02 c# linq linq-to-objects aggregate slice C#/.NET

C# Linq Group By 在多列上

公共类 ConsolidatedChild{公共字符串学校{得到；放;}公共字符串朋友{得到;放;}公共字符串FavoriteColor { get;放;}公共列表孩子{得到;放;}}公开课儿童{公共字符串学校{得到；放;}公共字符串名称 { 获取；放;}公共字符串地址{获取；放;}公共字符串朋友{得到;放;}公共字符串妈妈{得到;放;}公共字符串FavoriteColor { get;放;}} ..

发布时间：2021-12-09 10:53:23 c# linq group-by aggregate C#/.NET

做groupby时保留其他列

我在 Pandas 数据帧上使用 groupby 来删除所有没有特定列最小值的行.像这样: df1 = df.groupby("item", as_index=False)["diff"].min() 但是，如果我的列多于这两列，则其他列(例如，在我的示例中为 otherstuff)将被删除.我可以使用 groupby 保留这些列，还是必须找到不同的方法来删除行? 我的数据看起来像: ..

发布时间：2021-12-03 08:50:49 python pandas aggregate pandas-groupby Python

使用 pandas GroupBy.agg() 对同一列进行多个聚合

是否有 Pandas 内置方法可以将两个不同的聚合函数 f1, f2 应用于同一列 df[“returns"]，而无需调用agg() 多次? 示例数据框: 将pandas导入为pd将日期时间导入为 dt将 numpy 导入为 nppd.np.random.seed(0)df = pd.DataFrame({“日期": [dt.date(2012, x, 1) for x in range( ..

发布时间：2021-12-03 08:26:15 python pandas dataframe aggregate pandas-groupby Python

折叠行，其中一些都是 NA，其他与一些 NA 不相交

我有一个简单的数据框: ID Col1 Col2 Col3 Col41 呐呐呐呐呐1 5 10 不适用不适用1 不适用不适用 15 202 呐呐呐呐呐2 25 30 不适用不适用2 不适用不适用 35 40 我想重新格式化它: ID Col1 Col2 Col3 Col41 5 10 15 202 25 30 35 40 (请注意:真实数据集有数千行，值来自生物数据——NA 没有遵 ..

发布时间：2021-12-01 21:16:46 r aggregate na 其他开发

按组选择前 N 个值

这是对 r-help 邮件列表中提出的问题. 这里有很多的示例，说明如何找到顶部使用 sql 按组对值进行分组，所以我想通过使用 R sqldf 包很容易转换这些知识. 一个例子:当 mtcars 按 cyl 分组时，这里是 cyl 的每个不同值的前三个记录.请注意，在这种情况下不包括关系，但最好展示一些处理关系的不同方法. mpg cyl disp hp drat wt qsec ..

发布时间：2021-12-01 21:05:51 r aggregate 其他开发

有条件地应用函数

我有一个这样的数据框: 实验迭代结果A 1 30.0一个 2 23.0A 3 33.3乙 1 313.0乙 2 323.0B 3 350.0.... 有没有办法通过应用带有条件的函数来统计结果.在上面的示例中，该条件是特定实验的所有迭代. 结果总和 (30 + 23, + 33.3)B 结果总和 (313 + 323 + 350) 我正在考虑“应用"功能，但找不到让它工作的方法. 解 ..

发布时间：2021-12-01 21:03:16 r aggregate 其他开发

按组选择数据框中的第一行和最后一行

如何为以下数据框中的每个唯一 id 选择第一行和最后一行? tmp 解决方案 A plyr解决方案(tmp 是您的数据框): library("plyr")ddply(tmp, .(id), function(x) x[c(1, nrow(x)), ])# id d gr mm 面积# 1 15 1 2 3.4 1# 2 15 1 1 5.5 2# 3 21 1 1 4.0 2# 4 2 ..

发布时间：2021-12-01 20:58:05 r dataframe aggregate 其他开发

按多列分组并对其他多列求和

我有一个包含大约 200 列的数据框，其中我想按前 10 个左右的因素对表格进行分组，并对其余列求和. 我有我想要分组的所有列名的列表以及我想要聚合的所有列的列表. 我正在寻找的输出格式需要是具有相同列数的相同数据帧，只是组合在一起. 是否有使用包 data.table、plyr 或任何其他包的解决方案? 解决方案 data.table 方式是: DT[, lapply ..

发布时间：2021-12-01 20:34:03 r grouping aggregate plyr data.table 其他开发

提取数据帧中每个组内的最大值

我有一个带有分组变量(“Gene")和一个值变量(“Value")的数据框: 基因值一个 12一个 10乙 3乙 5乙 61D 34 对于我的分组变量的每个级别，我希望提取最大值.因此，结果应该是一个数据框，分组变量的每一级都有一行: 基因值一个 12乙 614 aggregate 可以解决问题吗? 解决方案在 R 中有很多可能性可以做到这一点.以下是其中一些: df % gr ..

发布时间：2021-12-01 20:29:07 r aggregate 其他开发

用dplyr总结多列?

我在 dplyr 语法上有点挣扎.我有一个包含不同变量和一个分组变量的数据框.现在我想使用 R 中的 dplyr 计算每组中每一列的平均值. df % group_by(grp) %>% summarise(mean(a)) 这给了我“grp"表示的每个组的“a"列的平均值. 我的问题是:是否有可能一次获得每个组中每一列的平均值?或者我必须为每一列重复 df %>% group_by(g ..

发布时间：2021-12-01 20:27:27 r dplyr aggregate 其他开发

按组提取变量最小值对应的行

我希望(1)按一个变量(State)对数据进行分组，(2)在每个组内找到另一个变量(Employees)的最小值行, 和 (3) 提取整行. (1) 和 (2) 是简单的单行，我觉得 (3) 也应该是，但我不明白. 这是一个示例数据集: >数据国营公司员工1 AK A 822 AK B 1043 AK C 374 AK D 245 RI E 196 RI F 1187 RI G 88 ..

发布时间：2021-12-01 20:27:17 r dplyr data.table aggregate 其他开发

在一次调用中按组对多个变量应用多个汇总函数

我有以下数据框 x 我想计算id1和id2分组的val1和val2的均值，同时计算每个id1-id2组合的行数.我可以单独执行每个计算: # 计算平均值聚合(.〜id1 + id2，数据= x，乐趣=平均值)# 计算行数聚合(.〜id1 + id2，数据= x，乐趣=长度) 为了在一次调用中进行两种计算，我尝试了 do.call("rbind",aggregate(.~id1 + id ..

发布时间：2021-12-01 20:26:39 r aggregate r-faq 其他开发

计算每组的行数并将结果添加到原始数据框中

假设我有一个 data.frame 对象: df 现在我想计算 name 和 type 的每个组合的行数(观察值).可以这样做: table(df[, c("name","type")]) 或者也可能使用 plyr，(虽然我不确定如何). 但是，如何将结果合并到原始数据框中?使结果看起来像这样: df# 名称类型 num 计数# 1 黑色椅子 4 2# 2 黑色椅子 5 2# 3 ..

发布时间：2021-12-01 20:25:37 r count aggregate r-faq 其他开发

按唯一标识符聚合并将相关值连接成字符串

我有一个我认为可以通过 aggregate 或 reshape 来满足的需求，但我不太清楚. 我有一个名称列表(brand)和随附的 ID 号(id).此数据为长格式，因此名称可以有多个 ID.我想按名称 (brand) 去除重复并将多个可能的 id 连接成一个由注释分隔的字符串. 例如: 品牌标识RadioShack 2308破布&骨4466抹布1830抹布4518拉尔夫劳伦 16 ..

发布时间：2021-12-01 20:25:02 r concatenation aggregate 其他开发

aggregate相关内容