python - pandas或者sklearn中如何将字符形式的标签数字化

查看:402
本文介绍了python - pandas或者sklearn中如何将字符形式的标签数字化的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

问 题

例如我有一个标签列形如:
[A,A,A,B,B,C,C,C,C]
转化为:
[0,0,0,1,1,2,2,2,2]

pandas和scikit-learn中有简单的实现吗?

另外大家在学习一个新的包时是怎样根据问题找到文档的具体位置的?有啥经验可以交流下吗?谢谢啦!

解决方案

pandas中是非常容易实现的,转换成Categories对象即可。术语叫做因子和水平,水平一般都会自动转成数字储存。

c = ['A','A','A','B','B','C','C','C','C']
category = pd.Categorical(c)

接下来查看category的label即可

print category.labels

这篇关于python - pandas或者sklearn中如何将字符形式的标签数字化的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆