如何使用python pandas从数据框中删除重复的列 [英] How to remove duplicate columns from a dataframe using python pandas

查看:175
本文介绍了如何使用python pandas从数据框中删除重复的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

通过将两列分组,我进行了一些更改.

By grouping two columns I made some changes.

我使用python生成了一个文件,它导致2个重复的列.如何从数据框中删除重复的列?

I generated a file using python, it resulted in 2 duplicate columns. How to remove duplicate columns from a dataframe?

推荐答案

使用groupby(假设它们也有重复的名称)可能是最简单的:

It's probably easiest to use a groupby (assuming they have duplicate names too):

In [11]: df
Out[11]:
   A  B  B
0  a  4  4
1  b  4  4
2  c  4  4

In [12]: df.T.groupby(level=0).first().T
Out[12]:
   A  B
0  a  4
1  b  4
2  c  4

如果它们具有不同的名称,则可以drop_duplicates进行移调:

If they have different names you can drop_duplicates on the transpose:

In [21]: df
Out[21]:
   A  B  C
0  a  4  4
1  b  4  4
2  c  4  4

In [22]: df.T.drop_duplicates().T
Out[22]:
   A  B
0  a  4
1  b  4
2  c  4

通常read_csv通常会确保它们使用不同的名称...

Usually read_csv will usually ensure they have different names...

这篇关于如何使用python pandas从数据框中删除重复的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆