添加包含数值列的入库值的列 [英] Add column which contains binned values of a numeric column

查看:10
本文介绍了添加包含数值列的入库值的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个包含几列的数据框,其中一列是RANK,它是介于1和20之间的整数。我想创建另一列,其中包含"1-4"、"5-10"、"11-15"、"16-20"之类的bin值。

执行此操作的最有效方法是什么?

我拥有的数据框如下所示(.csv格式):

rank,name,info
1,steve,red
3,joe,blue
6,john,green
3,liz,yellow
15,jon,pink

并且我想将另一列添加到数据框中,因此它将如下所示:

rank,name,info,binValue
1,steve,red,"1-4"
3,joe,blue,"1-4"
6,john,green, "5-10"
3,liz,yellow,"1-4"
15,jon,pink,"11-15"

我现在使用的方法不起作用,因为我希望保持data.Frame完好无损,如果df$randed的值在给定范围内,则只需添加另一列。谢谢。

推荐答案

请参阅?cut并指定breaks(也可能是labels)。

x$bins <- cut(x$rank, breaks=c(0,4,10,15), labels=c("1-4","5-10","10-15"))
x
#   rank  name   info  bins
# 1    1 steve    red   1-4
# 2    3   joe   blue   1-4
# 3    6  john  green  5-10
# 4    3   liz yellow   1-4
# 5   15   jon   pink 10-15

这篇关于添加包含数值列的入库值的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆