对重复的列进行分组,并使用pandas对相应的列值求和 [英] Group duplicate columns and sum the corresponding column values using pandas

查看:1578
本文介绍了对重复的列进行分组,并使用pandas对相应的列值求和的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在预处理apache服务器日志数据.我有3列ID,TIME和BYTES.示例:

I am preprocessing apache server log data. I have 3 columns ID, TIME, and BYTES. Example:

ID  时间  字节

ID     TIME     BYTES

1   13:00   10

1     13:00     10

2   13:02   30

2     13:02     30

3   13:03   40

3     13:03     40

4   13:02   50

4     13:02     50

5   13:03   70

5     13:03     70

我想实现以下目标:

ID  时间  字节

ID     TIME     BYTES

1   13:00   10

1     13:00     10

2   13:02   80

2     13:02     80

3   13:03   110

3     13:03     110

推荐答案

让我们尝试:

df['TIME'] = pd.to_datetime(df['TIME'])
ax = df.groupby('TIME')['BYTES'].sum().plot()
ax.set_xlim('13:00:00','13:03:00')

输出:

这篇关于对重复的列进行分组,并使用pandas对相应的列值求和的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
相关文章
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆