添加包含数值列的入库值的列 [英] Add column which contains binned values of a numeric column
本文介绍了添加包含数值列的入库值的列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个包含几列的数据框,其中一列是RANK,它是介于1和20之间的整数。我想创建另一列,其中包含"1-4"、"5-10"、"11-15"、"16-20"之类的bin值。
执行此操作的最有效方法是什么?
我拥有的数据框如下所示(.csv格式):
rank,name,info
1,steve,red
3,joe,blue
6,john,green
3,liz,yellow
15,jon,pink
并且我想将另一列添加到数据框中,因此它将如下所示:
rank,name,info,binValue
1,steve,red,"1-4"
3,joe,blue,"1-4"
6,john,green, "5-10"
3,liz,yellow,"1-4"
15,jon,pink,"11-15"
我现在使用的方法不起作用,因为我希望保持data.Frame完好无损,如果df$randed的值在给定范围内,则只需添加另一列。谢谢。
推荐答案
请参阅?cut
并指定breaks
(也可能是labels
)。
x$bins <- cut(x$rank, breaks=c(0,4,10,15), labels=c("1-4","5-10","10-15"))
x
# rank name info bins
# 1 1 steve red 1-4
# 2 3 joe blue 1-4
# 3 6 john green 5-10
# 4 3 liz yellow 1-4
# 5 15 jon pink 10-15
这篇关于添加包含数值列的入库值的列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文