在保留 pandas 的NaN的同时放下重复项 [英] Drop duplicates while preserving NaNs in pandas

查看：77 发布时间：2020/5/24 1:51:03 python pandas

本文介绍了在保留 pandas 的NaN的同时放下重复项的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

使用drop_duplicates()方法时，我减少了重复项，但也将所有NaNs合并为一个条目.

When using the drop_duplicates() method I reduce duplicates but also merge all NaNs into one entry. How can I drop duplicates while preserving rows with an empty entry (like np.nan, None or '')?

import pandas as pd
df = pd.DataFrame({'col':['one','two',np.nan,np.nan,np.nan,'two','two']})

Out[]: 
   col
0  one
1  two
2  NaN
3  NaN
4  NaN
5  two
6  two


df.drop_duplicates(['col'])

Out[]: 
   col
0  one
1  two
2  NaN

推荐答案

尝试

df[(~df.duplicated()) | (df['col'].isnull())]

结果是:

col
0   one
1   two
2   NaN
3   NaN     
4   NaN

这篇关于在保留 pandas 的NaN的同时放下重复项的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

在保留 pandas 的NaN的同时放下重复项 [英] Drop duplicates while preserving NaNs in pandas

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录关闭

在保留 pandas 的NaN的同时放下重复项 [英] Drop duplicates while preserving NaNs in pandas

问题描述

推荐答案

相关文章

Python最新文章

热门教程

热门工具

登录 关闭

登录关闭