按 pandas 数据框分组并在每组中选择最新的 [英] group by pandas dataframe and select latest in each group
本文介绍了按 pandas 数据框分组并在每组中选择最新的的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
如何对熊猫数据框的值进行分组并从每组中选择最新的(按日期)?
How to group values of pandas dataframe and select the latest(by date) from each group?
例如,给定一个按日期排序的数据框:
For example, given a dataframe sorted by date:
id product date
0 220 6647 2014-09-01
1 220 6647 2014-09-03
2 220 6647 2014-10-16
3 826 3380 2014-11-11
4 826 3380 2014-12-09
5 826 3380 2015-05-19
6 901 4555 2014-09-01
7 901 4555 2014-10-05
8 901 4555 2014-11-01
按 id 或产品分组,并选择最早的给出:
grouping by id or product, and selecting the earliest gives:
id product date
2 220 6647 2014-10-16
5 826 3380 2015-05-19
8 901 4555 2014-11-01
推荐答案
use idxmax
in groupby
和 slice df
with loc
use idxmax
in groupby
and slice df
with loc
df.loc[df.groupby('id').date.idxmax()]
id product date
2 220 6647 2014-10-16
5 826 3380 2015-05-19
8 901 4555 2014-11-01
这篇关于按 pandas 数据框分组并在每组中选择最新的的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文