group-by - IT屋-程序员软件开发技术分享社区

R分组依据和计数

我正在处理的数据集如下 Id Date Color 10 2008-11-17 Red 10 2008-11-17 Red 10 2008-11-17 Blue 10 2010-01-26 Red 10 2010-01-2 ..

发布时间：2022-09-03 15:56:42 r group-by dplyr plyr reshape2 其他开发

Clickhouse-如何使用向前填充的缺失值进行分组

我在Clickhouse中有一个表，其结构为： x_id | y_id | z_id | rank | timestamp 1231 | 1324 | 9412 | 1 | 2021-03-12 00:13:34 121 | 5524 | 765 | 21 | 2021-03-13 15:43:21 54 | 76 | 8822 | 125 | 2021-05-14 ..

发布时间：2022-09-02 15:56:47 group-by missing-data clickhouse 其他开发

通过填充丢失的日期和对称地上下迭代日期以找到r中最接近的值来表示补偿

我需要计算每个id的可用日期之间的所有丢失日期，然后对称地上下移动以计算丢失。此外，我并不总是需要两个日期之间的平均值，例如：当我上下移动两个日期时，我只看到一个值，那么我就会计算那个值。 df1 ..

发布时间：2022-09-02 14:59:12 r dataframe group-by missing-data 其他开发

查询2020年1月连续购物3天的客户数量

我有一个名为Orders的表格，其中包含客户ID及其订单日期(注意：同一客户在一天内可以有多个订单) create table orders (Id char, order_dt date) insert into orders values ('A','1/1/2020'), ('B','1/1/2020'), ('C','1/1/2020'), ('D','1/1/2020'), (' ..

发布时间：2022-08-14 17:25:40 sql oracle group-by window-functions 数据库

MySQL大小写、总和、分组依据

我希望根据PaymentStatus值从两个不同的列获得支付状态的总和-但此查询返回NULL作为总和。为什么它不工作？ select payment_status, CASE WHEN 'PAID' THEN sum(paid_amount) when 'Not Paid' then sum(total_amount_due ) END from monthly_fee group by ..

发布时间：2022-08-04 20:36:42 mysql group-by sum case 数据库

T_Table2的结构为 ID INT TBL1_ID INT TESTER VARCHAR LOT_ID VARCHAR GRP VARCHAR SITE_NUM INT TEST_NUM VARCHAR TEST_DESC VARCHAR MEASUREMENT DOUBLE PRECISION UNIT VARCHAR LL DOUBLE PRECISION UL DOUBLE PRE ..

发布时间：2022-07-23 13:07:25 sql group-by firebird 其他开发

GROUP BY in JavaScript-平面数组到嵌套的JSON

我的前端打字文件中有以下列表：月： 0: {id: 1, companyName: "company14", companyId: 14, flActive: true, purchaseMonth: "2019-12-15T00:00:00", purchaseMonthString: "Dec-2019" , year: 2019, month: "December"} 1: { ..

发布时间：2022-07-01 10:21:06 javascript json typescript group-by javascript-objects 前端开发

在Python pandas 中有没有SQL GROUP BY ROLLUP的等价物？

Here是它在Oracle中的工作方式。我在Pandas中寻找一个简洁的等价物，最好是与DataFrame to Python笔记本的呈现集成在一起。GROUP BY ROLLUP的要点是，如果您按多个列分组，您还将看到聚合，就好像是按这些列的子集分组一样。推荐答案参考此答案Pandas Pivot tables row subtotals 它使用SPIVOT_TABLE() ..

发布时间：2022-06-29 19:25:11 python sql pandas group-by grouping Python

使用ID和ASOF合并两个数据帧

我有两个数据框要拼接在一起，左边的数据框有信息索引by(日期，ID)，右边的数据框有信息索引by(Period，ID)，周期是年-月。结束时，我对左侧帧执行了GROUP BY ID，遍历各个组，在右侧帧上选择相同的组，然后对左侧数据框中组的索引执行AND ASF操作，如下所示： def merge_func(base_df, si_df): df_list = list( ..

发布时间：2022-06-24 15:25:27 python merge group-by pandas time-series Python

pandas 与Groupby一起滚动最大值

我无法让 pandas 的rolling函数执行我想要的操作。我想让每个FROW计算到目前为止组内的最大值。下面是一个例子： df = pd.DataFrame([[1,3], [1,6], [1,3], [2,2], [2,1]], columns=['id', 'value']) 看起来像 id value 0 1 3 1 1 6 2 1 ..

发布时间：2022-06-22 13:42:08 python python-3.x pandas dataframe group-by Python

IterTools使用lambda函数分组，如果列表的子列表在索引0和1处有匹配值，则将它们分组在一起

我有一个这样的列表列表： data = [['a', 'b', 2000, 100], ['a', 'b', 4000, 500], ['c', 'd', 500, 8000], ['c', 'd', 60, 8000], ['c', 'd', 70, 1000], ['a', 'd', 2000, 100], ['a', 'd', 1000, 100]] 如果它们具有相同的前两个值，我 ..

发布时间：2022-06-14 11:31:29 python performance group-by itertools Python

向Spark数据框中的每个组添加数据行

我有这个数据帧- data = [(0,1,1,201505,3), (1,1,1,201506,5), (2,1,1,201507,7), (3,1,1,201508,2), (4,2,2,201750,3), (5,2,2,201751,0), (6,2,2,201752,1), ..

发布时间：2022-06-11 14:34:14 dataframe pyspark group-by datetime-format week-number 其他开发

使用CASE的键|值表旋转&Q；将返回空列...MySQL

我正在尝试将键|值格式的数据转换为每个条目一行。源数据库是MySQL，我知道我需要使用CASE语句才能透视，并在此站点上遵循了一些示例来构造我的查询。但是，我只能取回一列数据，其余列中有空格。源表格式用户ID 元密钥 Meta_Value 1 名字约翰 1 Key_2 ETC 查询 SELECT `user_id`, case when `meta_k ..

发布时间：2022-06-06 20:28:35 mysql group-by pivot key-value 数据库

2个属性上的GROUP-BY数组和REDUTE

我想按2个属性对对象数组进行分组。我如何才能做到这一点？我得到了这个数组： [ { "nome": "Beatrice Mattos", "apelido": "Beatrice", "dt_extrato": "2020-05-26T00:00:00", "dt_inicio": "2020-05-26T15: ..

发布时间：2022-05-24 09:55:15 javascript arrays group-by reduce 前端开发

按ID和结果分组，取特定结果的最早日期并指定编号(即Outcome1、Outcome2)

如果我没有解释清楚，很抱歉。但我有以下数据集： mydata = data.frame (Id =c (1,1,1,1,1,1,1,1,2,2,2,2), Date = c("2001-01-31", "2001-02-13","2001-05-31", "2001-06-02","2018-01-31","2018-03-31","2018-07-31", "2019-04-04", ..

发布时间：2022-05-07 15:21:18 r group-by data-manipulation 其他开发

不带pl/SQL的SQL GROUP TABLE BY"；前导行(&Q)

我有一个包含两列的表格(小示例) 1 a 2 a 3 a3 4 a 5 a 6 a6 7 a 8 a8 9 a 我想将它们分组/划分为由前导“a”分隔的组，理想情况下是添加另一列，这样我就可以轻松地处理这些组。 1 a 0 2 a 0 3 a3 3 4 a 3 5 a 3 6 a6 6 7 a 6 8 a8 8 9 a 8 问题是表的设置是动态的，所以我不能使用静态 ..

发布时间：2022-04-19 14:24:17 sql postgresql group-by window-functions 其他开发

如何从Clickhouse中选择带有百分比的数据？

给出下表： CREATE TABLE main ( `job_id` UUID, `request_time` DateTime, `host_id` UInt8, `status_code` LowCardinality(String), ) ENGINE = MergeTree ORDER BY request_time SETTINGS index_gr ..

发布时间：2022-04-16 14:49:52 sql group-by common-table-expression percentage clickhouse 其他开发

DASK DataFrame Groupby导致一个分区内存问题

我正在将64个压缩的CSV文件(可能为70-80 GB)读入到一个DASK数据帧中，然后使用聚合运行Groupby。作业从未完成，因为Groupby似乎创建了一个只有一个分区的数据框。 This post和this post已经解决了此问题，但重点关注计算图形，而不是在生成的数据帧太大时遇到的内存问题。我尝试了重新分区的解决方法，但作业仍然无法完成。我做错了什么，必须 ..

发布时间：2022-04-14 16:19:15 group-by dask dask-distributed 其他开发

滚动计算以识别两列之间的不匹配

我的数据包括学生在mid-terms及其final考试中的分数。此数据以wide 格式排列，其中每行对应一个显示为SUID的唯一学生ID。我的数据还包括教师信息，如TUserId所示。每名教师可以有多名学生，因此有多行通用的教师ID。我有兴趣了解是否有老师在期中考试中给学生相似的分数(如mid_sum所示)，但在期末考试中给学生的分数不一致(如final_sum所示)。为了 ..

发布时间：2022-04-01 10:38:33 r group-by multiple-columns rolling-computation 其他开发

巨蟒 pandas 计算日期之间的平均天数

使用以下巨蟒 pandas 数据帧df： Customer_ID | Transaction_ID ABC 2016-05-06-1234 ABC 2017-06-08-3456 ABC 2017-07-12-5678 ABC 2017-12-20-6789 BCD 2016-08- ..

发布时间：2022-03-31 09:00:44 python pandas if-statement group-by average Python

group-by相关内容