获取多列的唯一值作为pandas中的新数据框 [英] Get unique values of multiple columns as a new dataframe in pandas
本文介绍了获取多列的唯一值作为pandas中的新数据框的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
具有至少包含C1,C2,C3列的熊猫数据框df
,您将如何获得所有唯一的C1,C2,C3值作为新的DataFrame?
Having pandas data frame df
with at least columns C1,C2,C3 how would you get all the unique C1,C2,C3 values as a new DataFrame?
换句话说,类似于:
SELECT C1,C2,C3
FROM T
GROUP BY C1,C2,C3
尝试过
print df.groupby(by=['C1','C2','C3'])
但是我得到
<pandas.core.groupby.DataFrameGroupBy object at 0x000000000769A9E8>
推荐答案
I believe you need drop_duplicates
if want all unique triples:
df = df.drop_duplicates(subset=['C1','C2','C3'])
如果要使用groupby
,请添加 first
:
If want use groupby
add first
:
df = df.groupby(by=['C1','C2','C3'], as_index=False).first()
这篇关于获取多列的唯一值作为pandas中的新数据框的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文