pandas-groupby相关内容
我有一个从CoinMarketcap上刮来的DF。我正在尝试计算CLOSE_PRICE列的卷度量,但在使用GROUPBY时收到错误消息: final_coin_data['vol'] = final_coin_data.groupby('coin_name')['close_price'].rolling(window=30).std() TypeError: incompatible in
..
我想做groupby、shift和cumsum,这看起来相当琐碎的任务,但我仍然对得到的结果头晕目眩。有没有人能告诉我我做错了什么。我在网上找到的所有结果都显示出与我正在做的事情相同或相同的变化。下面是我的实现。 temp = pd.DataFrame(data=[['a',1],['a',1],['a',1],['b',1],['b',1],['b',1],['c',1],['c',1]]
..
我有下面提到格式的 pandas 数据帧 input_df : gw_mac mac val status 0 AC233FC01403 AC233F264A4C -21 Outwards 1 AC233FC015F6 AC233F264A4C -37 Outwards 2 AC233FC01403 AC233F2
..
我需要一些 pandas 方面的帮助。 我有以下数据帧: df = pd.DataFrame({'1Country': ['FR', 'FR', 'GER','GER','IT','IT', 'FR','GER','IT'], '2City': ['Paris', 'Paris', 'Berlin', 'Berlin', 'Rome', 'Rome','P
..
有没有办法在groupby和mean()之后保留类别变量? 例如,给定数据帧df: ratio Metadata_A Metadata_B treatment 0 54265.937500 B10 1 AB_cmpd_01 11 107364.750000 B
..
我有几位奥斯卡获奖者的数据集。我有以下几栏:获奖者姓名、奖项、出生地、出生日期和年份。我想检查一下每年有多少排被填满。让我们说,2005年我们有最佳导演和最佳男演员的获胜者,2006年我们有最佳男配角的获胜者。我想得到这样的结果: 年奖 ; ;行数 2005 ; ; ; ;2 2006年 ; ;1 它看起来很简单,但我做不
..
给定范围表(start, end): name blue green yellow purple a 1, 5 654, 678 11, 15 b 88761, 88776 c 1
..
我的数据帧看起来像 df = pd.DataFrame(data={'ID':[1,1,1,2,2,2], 'Value':[13, 12, 15, 4, 2, 3]}) Index ID Value 0 1 13 1 1 12 2 1 15 3 2 4 4 2 2 5 2 3 我想按ID(类别)来绘制它,这样每个类别就会有不同的条形图,
..
我有一个这样的DataFrame。df: 我将以下函数应用于df df_new = df.groupby(pd.Grouper(key="longtime",freq="D")).agg({df.columns[1]: [np.max]}) df_new = pd.DataFrame(data= df_new) print(df_new) 下面您将看到df_new的输出。DatFr
..
我的数据帧: dfd = pd.DataFrame({'A': ['Apple','Apple', 'Apple','Orange','Orange','Orange','Pears','Pears'], 'B': [1,2,9,6,4,3,2,1] }) A B 0 Apple 1 1
..
我当前有一个数据集,其中我尝试根据列对行进行分组,并对值为整数的列求和。 但是,问题是,一旦总和达到特定阈值,我想创建一个新行 例如,在下面的数据框中,我尝试根据公司名称对行进行分组并合计权重,但是我不希望权重超过100。 输入数据帧: 公司 权重 a 30 b 45 a 27 a 40 b 57 a 57 b 32 输出数据帧: 公司 权重 a
..
我正在使用表中的两列。 +-------------+--------------------------------------------------------------+ | Area Name | Code Description | +-------------+------------
..
假设我有一个数据帧,并且我正在查看其中的2列(2个系列)。 使用下面的其中一列--"no_employees"--有人能帮我弄清楚如何创建6个不同的饼图或条形图(每个NO_Employees组1个)来说明处理列中的Yes/No值的值计数吗?我将使用matplotlib或seaborn,只要您觉得最简单。 我使用附加的代码行生成下面的代码。 dataframe_title.groupb
..
我有一个数据帧,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。 DF Cashier# Store# Sales Refunds 001 001 100 1 002 001 150 2 003 001 2
..
若要获得对与原始DataFrame(相同观测计数)相同详细级别的Groupby数据执行的结果,我使用了Transform函数。 示例: 原始数据帧 name, year, grade Jack, 2010, 6 Jack, 2011, 7 Rosie, 2010, 7 Rosie, 2011, 8 GROUPBY转换后 name, year, grade, average g
..
我有一个DataFramedf: A B C date O 4 5 5 2019-06-2 1 3 5 2 2019-06-2 2 3 2 1 2019-06-2 3 4 4 3 2019-06-3 4 5 4 6 2019-06-3 5 2 3 7 2019-06-
..
我有一个CSV文件,其中包含性别和婚姻状况,以及一些类似下面的列。 Loan_ID,Gender,Married,Dependents,Education,Self_Employed,ApplicantIncome,CoapplicantIncome,LoanAmount,Loan_Amount_Term,Credit_History,Property_Area,Loan_Status LP
..
我有一个数据帧DF,如下所示: | date | Revenue | |-----------|---------| | 6/2/2017 | 100 | | 5/23/2017 | 200 | | 5/20/2017 | 300 | | 6/22/2017 | 400 | | 6/21/2017 | 500 | 以上数据需要按月分组输
..
我有一个根据id列分组的数据帧。对于每个组,我希望获得包含最大值的行(整行,而不仅仅是值)。我可以这样做:首先获取每个组的最大值,然后创建一个过滤数组,然后在原始数据帧上应用过滤。就像这样 import pandas as pd # Dummy data df = pd.DataFrame({'id' : [1, 1, 1, 2, 2, 2, 3, 3, 4, 4, 4, 4],
..
我在以下数据集上使用了这段巧妙的代码 df = pd.DataFrame({ 'contact_email': ['info@info.com', 'info@info.com', 'info@info.com'], 'interest': ['Math', 'Science', 'Science'] }) print(df) interest co
..