pandas 合并列以创建具有逗号分隔值的新列 [英] pandas merge columns to create new column with comma separated values
本文介绍了 pandas 合并列以创建具有逗号分隔值的新列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我的数据框有四列颜色。我想将它们合并到一个名为"Colors"的列中,并使用逗号分隔值。
例如,我正在尝试合并到一个颜色列中,如下所示:
ID Black Red Blue Green Colors
120 NaN red NaN green red, green
121 black Nan blue NaN black, blue
我的代码是:
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x), axis=1)
但是ID 120的输出是:
、红色、、绿色
ID 121的输出为: 黑色,蓝色,
找到我的问题了! 在前面的代码中,我将"None"替换为"",而不是NaN。进行更改后,再加上插入[x.notull()]的反馈,它就可以工作了!
df['Black'].replace('None', np.nan, inplace=True)
df['Colors'] = df[['Black, 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis=1)
推荐答案
您只需处理NAN
df['Colors'] = df[['Black', 'Red', 'Blue', 'Green']].apply(lambda x: ', '.join(x[x.notnull()]), axis = 1)
ID Black Red Blue Green Colors
0 120 NaN red NaN green red, green
1 121 black NaN blue NaN black, blue
这篇关于 pandas 合并列以创建具有逗号分隔值的新列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文