对重复的列进行分组,并使用pandas对相应的列值求和 [英] Group duplicate columns and sum the corresponding column values using pandas
问题描述
我正在预处理apache服务器日志数据.我有3列ID,TIME和BYTES.示例:
I am preprocessing apache server log data. I have 3 columns ID, TIME, and BYTES. Example:
ID  时间  字节
ID     TIME     BYTES
1   13:00   10
1     13:00     10
2   13:02   30
2     13:02     30
3   13:03   40
3     13:03     40
4   13:02   50
4     13:02     50
5   13:03   70
5     13:03     70
我想实现以下目标:
ID  时间  字节
ID     TIME     BYTES
1   13:00   10
1     13:00     10
2   13:02   80
2     13:02     80
3   13:03   110
3     13:03     110
推荐答案
让我们尝试:
df['TIME'] = pd.to_datetime(df['TIME'])
ax = df.groupby('TIME')['BYTES'].sum().plot()
ax.set_xlim('13:00:00','13:03:00')
输出:
这篇关于对重复的列进行分组,并使用pandas对相应的列值求和的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!