如何将 pandas 序列中的字符串转换为Dropna的空值? [英] How to convert 'NaN' strings in a pandas Series to null values for dropna?

查看:19
本文介绍了如何将 pandas 序列中的字符串转换为Dropna的空值?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我尝试了几种方法来清除DataFrame中特定Series中包含NaN的行,结果发现每个NaN条目都是'NaN'字符串,而不是空值。

在我的特定示例中,每一行代表一个国家/地区,因此我要从DataFrame中删除'GDP per Capita'列中没有GDP值的所有国家/地区。

我尝试了一些方法(失败):

df_noGDP = df
df_noGDP.dropna(axis=0, subset=['GDP per Capita']) 

df_noGDP = df.loc[df['GDP per Capita'] != np.nan]

当我调用df_noGDP时,我看到没有删除NaN值。我想我要么在某个地方犯了一个愚蠢的语法错误,要么我需要转换我的数据类型。

推荐答案

首先将字符串转换为NaN值:

df = df.replace('NaN', np.nan)

然后分配回指定要就地使用的方法:

df = df.dropna(subset=['GDP per Capita'])           # not in place version
df.dropna(subset=['GDP per Capita'], inplace=True)  # in place version

或者,将locnotnull一起使用,因为NaN != NaNby design

df = df.loc[df['GDP per Capita'].notnull()]

这篇关于如何将 pandas 序列中的字符串转换为Dropna的空值?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆