group-by相关内容

MySQL大小写、总和、分组依据

我希望根据PaymentStatus值从两个不同的列获得支付状态的总和-但此查询返回NULL作为总和。为什么它不工作? select payment_status, CASE WHEN 'PAID' THEN sum(paid_amount) when 'Not Paid' then sum(total_amount_due ) END from monthly_fee group by ..
发布时间:2022-08-04 20:36:42 数据库

在Python pandas 中有没有SQL GROUP BY ROLLUP的等价物?

Here是它在Oracle中的工作方式。我在Pandas中寻找一个简洁的等价物,最好是与DataFrame to Python笔记本的呈现集成在一起。GROUP BY ROLLUP的要点是,如果您按多个列分组,您还将看到聚合,就好像是按这些列的子集分组一样。 推荐答案 参考此答案Pandas Pivot tables row subtotals 它使用SPIVOT_TABLE() ..
发布时间:2022-06-29 19:25:11 Python

使用ID和ASOF合并两个数据帧

我有两个数据框要拼接在一起,左边的数据框有信息索引by(日期,ID),右边的数据框有信息索引by(Period,ID),周期是年-月。 结束时,我对左侧帧执行了GROUP BY ID,遍历各个组,在右侧帧上选择相同的组,然后对左侧数据框中组的索引执行AND ASF操作,如下所示: def merge_func(base_df, si_df): df_list = list( ..
发布时间:2022-06-24 15:25:27 Python

使用CASE的键|值表旋转&Q;将返回空列...MySQL

我正在尝试将键|值格式的数据转换为每个条目一行。源数据库是MySQL,我知道我需要使用CASE语句才能透视,并在此站点上遵循了一些示例来构造我的查询。 但是,我只能取回一列数据,其余列中有空格。 源表格式 用户ID 元密钥 Meta_Value 1 名字 约翰 1 Key_2 ETC 查询 SELECT `user_id`, case when `meta_k ..
发布时间:2022-06-06 20:28:35 数据库

DASK DataFrame Groupby导致一个分区内存问题

我正在将64个压缩的CSV文件(可能为70-80 GB)读入到一个DASK数据帧中,然后使用聚合运行Groupby。 作业从未完成,因为Groupby似乎创建了一个只有一个分区的数据框。 This post和this post已经解决了此问题,但重点关注计算图形,而不是在生成的数据帧太大时遇到的内存问题。 我尝试了重新分区的解决方法,但作业仍然无法完成。 我做错了什么,必须 ..
发布时间:2022-04-14 16:19:15 其他开发

滚动计算以识别两列之间的不匹配

我的数据包括学生在mid-terms及其final考试中的分数。 此数据以wide 格式排列,其中每行对应一个显示为SUID的唯一学生ID。 我的数据还包括教师信息,如TUserId所示。每名教师可以有多名学生,因此有多行通用的教师ID。 我有兴趣了解是否有老师在期中考试中给学生相似的分数(如mid_sum所示),但在期末考试中给学生的分数不一致(如final_sum所示)。为了 ..
发布时间:2022-04-01 10:38:33 其他开发