pandas-groupby相关内容

pandas :按移位分组和累加和(GroupBy Shift And Cumulative Sum)

我想做groupby、shift和cumsum,这看起来相当琐碎的任务,但我仍然对得到的结果头晕目眩。有没有人能告诉我我做错了什么。我在网上找到的所有结果都显示出与我正在做的事情相同或相同的变化。下面是我的实现。 temp = pd.DataFrame(data=[['a',1],['a',1],['a',1],['b',1],['b',1],['b',1],['c',1],['c',1]] ..
发布时间:2022-02-26 20:34:24 Python

我如何计算 pandas 中每组的行数?

我有几位奥斯卡获奖者的数据集。我有以下几栏:获奖者姓名、奖项、出生地、出生日期和年份。我想检查一下每年有多少排被填满。让我们说,2005年我们有最佳导演和最佳男演员的获胜者,2006年我们有最佳男配角的获胜者。我想得到这样的结果: 年奖 ; ;行数 2005 ; ; ; ;2 2006年 ; ;1 它看起来很简单,但我做不 ..
发布时间:2022-02-26 20:27:30 Python

pandas GROUP BY AND SUM,但在超过一定数量时创建新行

我当前有一个数据集,其中我尝试根据列对行进行分组,并对值为整数的列求和。 但是,问题是,一旦总和达到特定阈值,我想创建一个新行 例如,在下面的数据框中,我尝试根据公司名称对行进行分组并合计权重,但是我不希望权重超过100。 输入数据帧: 公司 权重 a 30 b 45 a 27 a 40 b 57 a 57 b 32 输出数据帧: 公司 权重 a ..
发布时间:2022-02-26 20:18:59 Python

如何将groupby()和value_count()转换为多个饼图/条形图

假设我有一个数据帧,并且我正在查看其中的2列(2个系列)。 使用下面的其中一列--"no_employees"--有人能帮我弄清楚如何创建6个不同的饼图或条形图(每个NO_Employees组1个)来说明处理列中的Yes/No值的值计数吗?我将使用matplotlib或seaborn,只要您觉得最简单。 我使用附加的代码行生成下面的代码。 dataframe_title.groupb ..
发布时间:2022-02-26 20:15:13 Python

pandas GROUPBY+变换和多列

若要获得对与原始DataFrame(相同观测计数)相同详细级别的Groupby数据执行的结果,我使用了Transform函数。 示例: 原始数据帧 name, year, grade Jack, 2010, 6 Jack, 2011, 7 Rosie, 2010, 7 Rosie, 2011, 8 GROUPBY转换后 name, year, grade, average g ..
发布时间:2022-02-26 20:11:37 Python

获取分组中具有最大值的行

我有一个根据id列分组的数据帧。对于每个组,我希望获得包含最大值的行(整行,而不仅仅是值)。我可以这样做:首先获取每个组的最大值,然后创建一个过滤数组,然后在原始数据帧上应用过滤。就像这样 import pandas as pd # Dummy data df = pd.DataFrame({'id' : [1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4], ..
发布时间:2022-02-26 20:05:28 Python