aggregate相关内容

R中按日期计算唯一值的数量

请帮我计算每个日期的唯一 ID 数.所以,最初,有这个 ID 和日期的数据框 ID 日期1 2009/11/11 2009/11/21 2009/11/22 2009/11/12 2009/11/12 2009/11/23 2009/11/13 2009/11/3 可以按日期重新排列.如果我们这样做,那么我们将看到在 1 日有 3 个唯一 ID.在第 2 个唯一 ID 和第 3 个唯一 ID ..
发布时间:2021-09-01 18:56:32 其他开发

SPSS按行分组并将字符串连接成一个变量

我正在尝试 使用 SPSS 语法将 SPSS 元数据 导出为自定义格式.带有值标签的数据集包含一个或多个变量标签. 但是,现在我想将每个变量的值标签连接成一个字符串.例如对于变量 SEX 组合或分组行 F/Female 和 M/Male 成一个变量 F=Female;M=Male;.我已经使用 Compute CodeValueLabel = concat(Code,'=',ValueLab ..
发布时间:2021-08-31 18:34:45 其他开发

按组计算最小值和最大值(范围)

我在数据框中有这样的东西: PersonId Date_Withdrawal一个 2012-05-01一个 2012-06-01乙 2012-05-012012-05-01一个 2012-07-01一个 2012-10-01乙 2012-08-01乙 2012-12-012012-07-01 我想通过“PersonId"获取最小和最大日期 解决方案 首先,转换为适当的日期类(始终是一个 ..
发布时间:2021-07-02 20:09:46 其他开发

重命名 PySpark DataFrame 聚合的列

我正在使用 PySpark DataFrames 分析一些数据.假设我有一个正在聚合的 DataFrame df: (df.groupBy("group").agg({“钱":“总和"}).show(100)) 这会给我: group SUM(money#2L)137461285853乙 172185566943电话 271179590646 聚合工作正常,但我不喜欢新的列名“SUM(mo ..
发布时间:2021-06-24 20:33:36 其他开发

R:在函数内使用聚合,不起作用

我对 R 还很陌生,如果我无法找到这个问题的答案,我深表歉意. 我无法用我自己的数据集复制我遇到的确切错误,但由于仍然产生了错误,所以我们继续.我想要做的是创建一个函数来计算几列的平均值,条件是其他列的值.让我们说 d1 如果我不包含 %>% filter(d3 = c) 位,效果会很好.当我包含它时,我得到UseMethod("filter_") 中的错误:没有适用于 'filter ..
发布时间:2021-06-18 19:18:36 其他开发

使用没有连接的聚合创建数据透视表

我想我正在尝试做一些无法完成的事情.我正在尝试创建一个数据透视表,通过聚合两个不同的列同时进行两个数据透视.我创建了一个非常简化的示例,以使这一点更易于理解. 创建表 two_aggregate_pivot (身份证号码,类别 CHAR(1),INT值)插入 dbo.two_aggregate_pivot( ID, 类别, 值)值 (1, 'A', 100),(1, 'B', 97),(1, ' ..
发布时间:2021-06-18 18:39:14 数据库

Pandas groupby 自定义组

假设我有一个这样的数据框: df = pd.DataFrame({'A': [1, 2, 3, 4, 5, 6], 'B': ['a', 'a', 'b', 'b', 'c', 'c']})打印(df)甲乙0 1 一1 2 一2 3 乙3 4 b4 5 厘米5 6 c 我如何按 col B 分组,使得组为 a、a OR b 和 a OR b OR c,而不仅仅是 a、b 和 c?为了这个例子, ..
发布时间:2021-06-14 18:32:18 Python

Pandas:分组后获取前 10 个值

我有一个带有“id"列和“value"列的 Pandas 数据框.它已经按第一个 id(升序)然后是值(降序)排序.我需要的是每个 id 的前 10 个值. 我认为类似以下内容会起作用,但它不会: df.groupby("id", as_index=False).aggregate(lambda (index,rows) : rows.iloc[:10]) 我得到的只是一个 id 列表, ..
发布时间:2021-06-13 20:53:59 Python

如何使用“命名聚合"

我想在 Pandas DataFrameGroupBy 的同一列上应用两个不同的聚合,并命名新列. 我已经尝试使用文档中显示的内容.https://pandas.pydata.org/pandas-docs/stable/user_guide/groupby.html#named-aggregation 在[82]中:animals.groupby("kind").agg(....: mi ..
发布时间:2021-06-13 20:02:18 Python

匹配猫鼬中的两个不同字段,聚合?

我正在尝试匹配同一文档中的两个不同字段.但没有得到我想要的预期输出.让我举个例子. 我想在相同的文档中将 weighted.phaseId 与 phases._id 匹配,不匹配应该从 phases 字段中删除.> 有人有想法吗? //处理数据库上的一些聚合查询后的文档. {"_id" : ObjectId("5a680c803096130f93d11c7a"),“加权":[{"p ..
发布时间:2021-06-03 20:02:30 其他开发

对象数组中的MongoDB聚合字段

我尝试解决一个问题已经有一段时间了,但不幸的是没有运气.因此,我正在重构一些旧代码(使用了所有已知的 get each doc 查询和 for 循环),并且我正在尝试汇总结果以删除 BE 正在进行的数千次调用. 当前文档看起来像这样 {"_id" : ObjectId("5c176fc65f543200019f8d66"),"category" : "新客户",“描述" : "","cre ..
发布时间:2021-06-03 19:59:45 其他开发

MongoDB:聚合查询以求和持续时间字段

我有一组记录,我需要总结要显示的持续时间 记录 [{id:“1",持续时间:“07:30:00"},{id:“1",持续时间:“07:30:00"}{id:“2",持续时间:“07:30:00"}] 输出 [{_id: 1,总持续时间:“15:00"},{_id: 2,总持续时间:“07:30"}] 解决方案 从 MongoDB version >= 4.4 开始,您可以使用 $f ..
发布时间:2021-06-03 19:47:31 其他开发