pandas 合并列以创建具有逗号分隔值的新列 [英] pandas merge columns to create new column with comma separated values

查看:30
本文介绍了 pandas 合并列以创建具有逗号分隔值的新列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我的数据框有四列颜色。我想将它们合并到一个名为"Colors"的列中,并使用逗号分隔值。

例如,我正在尝试合并到一个颜色列中,如下所示:

ID  Black Red  Blue  Green  Colors   
120 NaN   red  NaN   green  red, green  
121 black Nan  blue  NaN    black, blue

我的代码是:

df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x), axis=1)
但是ID 120的输出是: 、红色、、绿色

ID 121的输出为: 黑色,蓝色,

找到我的问题了! 在前面的代码中,我将"None"替换为"",而不是NaN。进行更改后,再加上插入[x.notull()]的反馈,它就可以工作了!

df['Black'].replace('None', np.nan, inplace=True)
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis=1)

推荐答案

您只需处理NAN

df['Colors'] = df[['Black', 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis = 1)

    ID      Black   Red Blue    Green   Colors
0   120     NaN     red NaN     green   red, green
1   121     black   NaN blue    NaN     black, blue

这篇关于 pandas 合并列以创建具有逗号分隔值的新列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆