合并表格中的 pandas 时添加默认值 [英] Add default values while merging tables in pandas

查看:118
本文介绍了合并表格中的 pandas 时添加默认值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在用熊猫读取两个csv文件.

I'm reading two csv files with pandas.

df1= pd.read_csv('file_1.csv')
df2 = pd.read_csv('file_2.csv')
data =  pd.merge(df1, df2, on='id')

我面临的问题是,由于两个输入文件中都缺少一些id值,所以最终数据帧data的行数较少.我想做的是为其中的所有单元格设置一个默认值两种情况,例如:

The problem I'm facing is that the final data frame, data, has fewer rows since some id values are missing from both input files.What I'll like to do is to have a default value for all the cells in both cases, like:

data =  pd.merge(df1, df2, on='id',default_vaue=0)

推荐答案

您可以使用outer join并将NaN s替换为0:

You can use outer join and replace NaNs by 0:

注意:所有N aN都被0替换了,因此df1df2中的NaN也被替换了.

Notice: All NaNs are replaced by 0, so NaNs in df1 or df2 are replaced too.

data = pd.merge(df1, df2, on='id',how='outer').fillna(0)

这篇关于合并表格中的 pandas 时添加默认值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆