如何使用python pandas从数据框中删除重复的列 [英] How to remove duplicate columns from a dataframe using python pandas
本文介绍了如何使用python pandas从数据框中删除重复的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
通过将两列分组,我进行了一些更改.
By grouping two columns I made some changes.
我使用python生成了一个文件,它导致2个重复的列.如何从数据框中删除重复的列?
I generated a file using python, it resulted in 2 duplicate columns. How to remove duplicate columns from a dataframe?
推荐答案
使用groupby(假设它们也有重复的名称)可能是最简单的:
It's probably easiest to use a groupby (assuming they have duplicate names too):
In [11]: df
Out[11]:
A B B
0 a 4 4
1 b 4 4
2 c 4 4
In [12]: df.T.groupby(level=0).first().T
Out[12]:
A B
0 a 4
1 b 4
2 c 4
如果它们具有不同的名称,则可以drop_duplicates
进行移调:
If they have different names you can drop_duplicates
on the transpose:
In [21]: df
Out[21]:
A B C
0 a 4 4
1 b 4 4
2 c 4 4
In [22]: df.T.drop_duplicates().T
Out[22]:
A B
0 a 4
1 b 4
2 c 4
通常read_csv
通常会确保它们使用不同的名称...
Usually read_csv
will usually ensure they have different names...
这篇关于如何使用python pandas从数据框中删除重复的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文