在数据框中随机采样一定百分比的行 [英] Randomly sample a percentage of rows within a data frame
本文介绍了在数据框中随机采样一定百分比的行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
与此问题有关.
gender <- c("F", "M", "M", "F", "F", "M", "F", "F")
age <- c(23, 25, 27, 29, 31, 33, 35, 37)
mydf <- data.frame(gender, age)
mydf[ sample( which(mydf$gender=='F'), 3 ), ]
代替选择行数(在上述情况下为3),我如何随机选择20%带有"F"的行?因此,在带有"F"的五行中,如何随机采样其中的20%.
Instead of selecting a number of rows (3 in above case), how can I randomly select 20% of rows with "F"? So of the five rows with "F", how do I randomly sample 20% of those rows.
推荐答案
这是怎么回事:
mydf[ sample( which(mydf$gender=='F'), round(0.2*length(which(mydf$gender=='F')))), ]
其中0.2是您的20%,length(which(mydf$gender=='F'))
是具有F
的行总数
Where 0.2 is your 20% and length(which(mydf$gender=='F'))
is the total number of rows with F
这篇关于在数据框中随机采样一定百分比的行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文