将组平均值分配给Python/PANAS中的每一行 [英] Assign group averages to each row in python/pandas

查看:29
本文介绍了将组平均值分配给Python/PANAS中的每一行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个数据帧,我希望根据商店和所有商店计算平均值。我创建了计算平均值的代码,但我正在寻找一种更有效的方法。

DF

Cashier#     Store#     Sales    Refunds
001          001        100      1
002          001        150      2
003          001        200      2
004          002        400      1
005          002        600      4

DF-所需

Cashier#     Store#     Sales    Refunds     Sales_StoreAvg    Sales_All_Stores_Avg
001          001        100      1            150               290
002          001        150      2            150               290
003          001        200      2            150               290
004          002        400      1            500               290
005          002        600      4            500               290

我的尝试 我创建了另外两个数据帧,然后执行左连接

df.groupby(['Store#']).sum().reset_index().groupby('Sales').mean() 

推荐答案

我认为新列需要GroupBy.transformmean的聚合值填充:

df['Sales_StoreAvg'] = df.groupby('Store#')['Sales'].transform('mean')
df['Sales_All_Stores_Avg'] = df['Sales'].mean()
print (df)
   Cashier#  Store#  Sales  Refunds  Sales_StoreAvg  Sales_All_Stores_Avg
0         1       1    100        1             150                 290.0
1         2       1    150        2             150                 290.0
2         3       1    200        2             150                 290.0
3         4       2    400        1             500                 290.0
4         5       2    600        4             500                 290.0

这篇关于将组平均值分配给Python/PANAS中的每一行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆