aggregate相关内容
假设我有一个名为 x 的矩阵. x
..
我继承了以下数据库设计.表是: 客户---------客户ID顾客号码发票--------发票编号数量发票付款---------------发票付款编号发票编号付款编号付款--------付款编号客户ID数量 我的查询需要返回给定客户编号的 invoiceid、发票金额(在发票表中)和应付金额(发票金额减去已针对发票支付的任何款项).一个客户可能有多张发票. 当对发票进行多次付款时,以下
..
我正在尝试查找与当前正在查看的标签相关的标签.我们索引中的每个文档都带有标签.每个标签由两部分组成 - ID 和文本名称: {...元:{...标签: [{编号:123,名称:'饼干'},{编号:456,名称:'蛋糕'},{编号:789,名称:'面包'}]}} 要获取相关标签,我只需查询文档并获取其标签的集合: {“询问": {“布尔":{“必须": [{“比赛": {“item.meta.
..
我使用 SUM-Aggregation 计算我的服务流程的持续时间.执行过程的每一步都将保存在 Elasticsearch 中的调用 Id 下. 这是我监控的: ID #123 的请求处理持续时间(调用服务 #1)ID #123 的服务器响应持续时间(调用服务 #1)**完成 ID #123 的持续时间**ID #124 的请求处理持续时间(调用服务 #1)ID #124 的服务器响应持续
..
在我们的一个新项目中,我们受到了这篇文章的启发 http://project-a.github.io/on-site-search-design-patterns-for-e-commerce/#generic-faceted-search用于制作我们的“facet"结构.虽然我已经让它在文章描述的范围内工作,但我在选择方面时遇到了让它工作的问题.我希望有人可以提供一些尝试的提示,这样我就不必再次
..
var nums = new[]{ 1, 2, 3, 4, 5, 6, 7};var pair =/* 这里有一些 linq 魔法 */; =>对 = { {1, 2}, {3, 4}, {5, 6}, {7, 0} } pairs 的元素应该是双元素列表,或者是一些具有两个字段的匿名类的实例,例如 new {First = 1, Second = 2}. 解决方案 没有任何默认的
..
公共类 ConsolidatedChild{公共字符串学校{得到;放;}公共字符串朋友{得到;放;}公共字符串FavoriteColor { get;放;}公共列表孩子{得到;放;}}公开课儿童{公共字符串学校{得到;放;}公共字符串名称 { 获取;放;}公共字符串地址{获取;放;}公共字符串朋友{得到;放;}公共字符串妈妈{得到;放;}公共字符串FavoriteColor { get;放;}}
..
我在 Pandas 数据帧上使用 groupby 来删除所有没有特定列最小值的行.像这样: df1 = df.groupby("item", as_index=False)["diff"].min() 但是,如果我的列多于这两列,则其他列(例如,在我的示例中为 otherstuff)将被删除.我可以使用 groupby 保留这些列,还是必须找到不同的方法来删除行? 我的数据看起来像:
..
是否有 Pandas 内置方法可以将两个不同的聚合函数 f1, f2 应用于同一列 df[“returns"],而无需调用agg() 多次? 示例数据框: 将pandas导入为pd将日期时间导入为 dt将 numpy 导入为 nppd.np.random.seed(0)df = pd.DataFrame({“日期": [dt.date(2012, x, 1) for x in range(
..
我有一个简单的数据框: ID Col1 Col2 Col3 Col41 呐呐呐呐呐1 5 10 不适用 不适用1 不适用 不适用 15 202 呐呐呐呐呐2 25 30 不适用 不适用2 不适用 不适用 35 40 我想重新格式化它: ID Col1 Col2 Col3 Col41 5 10 15 202 25 30 35 40 (请注意:真实数据集有数千行,值来自生物数据——NA 没有遵
..
这是对 r-help 邮件列表中提出的问题. 这里有很多的示例,说明如何找到顶部使用 sql 按组对值进行分组,所以我想通过使用 R sqldf 包很容易转换这些知识. 一个例子:当 mtcars 按 cyl 分组时,这里是 cyl 的每个不同值的前三个记录.请注意,在这种情况下不包括关系,但最好展示一些处理关系的不同方法. mpg cyl disp hp drat wt qsec
..
我有一个这样的数据框: 实验迭代结果A 1 30.0一个 2 23.0A 3 33.3乙 1 313.0乙 2 323.0B 3 350.0.... 有没有办法通过应用带有条件的函数来统计结果.在上面的示例中,该条件是特定实验的所有迭代. 结果总和 (30 + 23, + 33.3)B 结果总和 (313 + 323 + 350) 我正在考虑“应用"功能,但找不到让它工作的方法. 解
..
如何为以下数据框中的每个唯一 id 选择第一行和最后一行? tmp 解决方案 A plyr解决方案(tmp 是您的数据框): library("plyr")ddply(tmp, .(id), function(x) x[c(1, nrow(x)), ])# id d gr mm 面积# 1 15 1 2 3.4 1# 2 15 1 1 5.5 2# 3 21 1 1 4.0 2# 4 2
..
我有一个包含大约 200 列的数据框,其中我想按前 10 个左右的因素对表格进行分组,并对其余列求和. 我有我想要分组的所有列名的列表以及我想要聚合的所有列的列表. 我正在寻找的输出格式需要是具有相同列数的相同数据帧,只是组合在一起. 是否有使用包 data.table、plyr 或任何其他包的解决方案? 解决方案 data.table 方式是: DT[, lapply
..
我有一个带有分组变量(“Gene")和一个值变量(“Value")的数据框: 基因值一个 12一个 10乙 3乙 5乙 61D 34 对于我的分组变量的每个级别,我希望提取最大值.因此,结果应该是一个数据框,分组变量的每一级都有一行: 基因值一个 12乙 614 aggregate 可以解决问题吗? 解决方案 在 R 中有很多可能性可以做到这一点.以下是其中一些: df % gr
..
我在 dplyr 语法上有点挣扎.我有一个包含不同变量和一个分组变量的数据框.现在我想使用 R 中的 dplyr 计算每组中每一列的平均值. df % group_by(grp) %>% summarise(mean(a)) 这给了我“grp"表示的每个组的“a"列的平均值. 我的问题是:是否有可能一次获得每个组中每一列的平均值?或者我必须为每一列重复 df %>% group_by(g
..
我希望(1)按一个变量(State)对数据进行分组,(2)在每个组内找到另一个变量(Employees)的最小值行, 和 (3) 提取整行. (1) 和 (2) 是简单的单行,我觉得 (3) 也应该是,但我不明白. 这是一个示例数据集: >数据国营公司员工1 AK A 822 AK B 1043 AK C 374 AK D 245 RI E 196 RI F 1187 RI G 88
..
我有以下数据框 x 我想计算id1和id2分组的val1和val2的均值,同时计算每个id1-id2组合的行数.我可以单独执行每个计算: # 计算平均值聚合(.〜id1 + id2,数据= x,乐趣=平均值)# 计算行数聚合(.〜id1 + id2,数据= x,乐趣=长度) 为了在一次调用中进行两种计算,我尝试了 do.call("rbind",aggregate(.~id1 + id
..
假设我有一个 data.frame 对象: df 现在我想计算 name 和 type 的每个组合的行数(观察值).可以这样做: table(df[, c("name","type")]) 或者也可能使用 plyr,(虽然我不确定如何). 但是,如何将结果合并到原始数据框中?使结果看起来像这样: df# 名称类型 num 计数# 1 黑色椅子 4 2# 2 黑色椅子 5 2# 3
..
我有一个我认为可以通过 aggregate 或 reshape 来满足的需求,但我不太清楚. 我有一个名称列表(brand)和随附的 ID 号(id).此数据为长格式,因此名称可以有多个 ID.我想按名称 (brand) 去除重复并将多个可能的 id 连接成一个由注释分隔的字符串. 例如: 品牌标识RadioShack 2308破布&骨4466抹布1830抹布4518拉尔夫劳伦 16
..