首页
Python
pandas 丢弃重复数据而忽略了NaN

pandas 丢弃重复数据而忽略了NaN [英] Pandas drop duplicates ignoring NaN

查看：77 发布时间：2020/10/17 1:26:55 python pandas dataframe duplicates

本文介绍了 pandas 丢弃重复数据而忽略了NaN的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

在Pandas df中，我试图跨多列放置重复项。每行很多数据是 NaN 。

In a Pandas df, I am trying to drop duplicates across multiple columns. Lots of data per row is NaN.

这只是一个例子，数据杂乱无章，因此存在许多不同的组合。

This is only an example, the data is a mixed bag, so many different combinations exist.

df.drop_duplicates()

    IDnum       name            formNumber
1   NaN         AP GROUP        028-11964
2   1364615.0   AP GROUP        NaN
3   NaN         AP GROUP        NaN

有希望的输出：

    IDnum       name            formNumber
1   1364615.0   AP GROUP        028-11964

编辑：

如果 df。 drop_duplicates（）看起来像这样，会改变解决方案吗？：

If the df.drop_duplicates() looks like this, would it change the solution? :

df.drop_duplicates()

    IDnum       name            formNumber
0   NaN         AP GROUP        028-11964
1   1364615.0   AP GROUP        028-11964
2   1364615.0   AP GROUP        NaN
3   NaN         AP GROUP        NaN

推荐答案

您可以先使用 groupby +


df.groupby('name',as_index=False).first()
Out[206]: 
      name      IDnum formNumber
0  APGROUP  1364615.0  028-11964


                        这篇关于 pandas 丢弃重复数据而忽略了NaN的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            熊猫聚合忽略了NaN;
                        
                    
                    
                        
                            熊猫结合了两个字符串而忽略了nan值;
                        
                    
                    
                        
                            XSLT 帮助 - 重复数据;
                        
                    
                    
                        
                            ViewPager显示重复数据;
                        
                    
                    
                        
                            重复数据插入CodeIgniter;
                        
                    
                    
                        
                            MySQL:排除重复数据;
                        
                    
                    
                        
                            PHP SimpleXML重复数据;
                        
                    
                    
                        
                            mysql重复数据删除;
                        
                    
                    
                        
                            Pandas 和 python:按多个字段对数据集进行重复数据删除;
                        
                    
                    
                        
                            python pandas复数;
                        
                    
                    
                        
                            合并具有重复数据的数据;
                        
                    
                    
                        
                            忽略数据框中的 NaN;
                        
                    
                    
                        
                            Pandas - 用 Nan 替换重复项并保持行;
                        
                    
                    
                        
                            插入前检查重复数据;
                        
                    
                    
                        
                            重复数据框的行;
                        
                    
                    
                        
                            XML 中的重复数据;
                        
                    
                    
                        
                            重复数据帧的行;
                        
                    
                    
                        
                            查找数组中重复数据;
                        
                    
                    
                        
                            MySQL中重复数据停止;
                        
                    
                    
                        
                            重复数据帧N次;
                        
                    
                    
                        
                            如何防止重复数据输入？;
                        
                    
                    
                        
                            为什么要进行重复数据备份，而不是会话存储;
                        
                    
                    
                        
                            合并数据帧并丢弃重复值;
                        
                    
                    
                        
                            删除行内的Pandas重复值，替换为NaN，将NaN移至行尾;
                        
                    
                    
                        
                            角NG重复数据VS-NG重复;


    
        
            Python最新文章
            
                    
                        
                            类型错误：只有长度为1的阵列可以尝试拟合指数的数据转换到Python标量;
                        
                    
                    
                        
                            bs4.FeatureNotFound：找不到一棵树建设者您所要求的功能：LXML。你需要安装一个解析器库？;
                        
                    
                    
                        
                            系列的真值是不明确的。使用a.empty，a.bool（），a.item（），a.any（）或a.all（）;
                        
                    
                    
                        
                            （unicode错误）'unicodeescape'编解码器无法解码位置2-3中的字节：truncated \UXXXXXXXX escape;
                        
                    
                    
                        
                            将pandas dataframe中的列从int转换为string;
                        
                    
                    
                        
                            Python：由实例对象调用方法：“missing 1 required positional argument：'self'”;
                        
                    
                    
                        
                            Sparksql过滤与多个条件（与where子句中选择）;
                        
                    
                    
                        
                            JSONDe codeError：期待值：1行1列（CHAR 0）;
                        
                    
                    
                        
                            Cmake不能找到Python库;
                        
                    
                    
                        
                            Python  - 将Dataframe中的所有项目转换为字符串;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.