r-faq相关内容
我有一个包含几列的数据框,其中一列是RANK,它是介于1和20之间的整数。我想创建另一列,其中包含“1-4”、“5-10”、“11-15”、“16-20”之类的bin值。 执行此操作的最有效方法是什么? 我拥有的数据框如下所示(.csv格式): rank,name,info 1,steve,red 3,joe,blue 6,john,green 3,liz,yellow 15,j
..
我要查找每个组的列的最小值和最大值: mtcars %>% group_by(mtcars$cyl) %>% summarize( min_mpg = min(mtcars$mpg), max_mpg = max(mtcars$mpg) ) # # A tibble: 3 x 3 # `mtcars$cyl` min_mpg max_mpg #
..
我要使用dplyr::mutate()在数据框中创建多个新列。应动态生成列名及其内容。 虹膜数据示例: library(dplyr) iris
..
..
R 是否有自然排序? 假设我有一个像这样的字符向量: seq.names
..
我正在尝试将我对 plyr 的理解转移到 dplyr,但我不知道如何按多列进行分组. # 使用无法硬编码的奇怪列名制作数据数据 = 数据帧(asihckhdoydkhxiydfgfTgdsx = 样本(字母[1:3],100,替换=真),a30mvxigxkghc5cdsvxvyv0ja = 样本(字母[1:3],100,替换=真),值 = rnorm(100))# 得到我们想要平均的列列 =
..
如何更改此输入(按顺序:时间、输入、输出、文件): 超时文件1 2 3 42 3 4 5 到这个输出(顺序为:time、out、in、files)? 文件超时1 3 2 42 4 3 5 这是虚拟 R 数据: table
..
我有以下数据框: A B C D Xax0.451 0.333 0.034 0.173 0.220.491 0.270 0.033 0.207 0.340.389 0.249 0.084 0.271 0.540.425 0.819 0.077 0.281 0.340.457 0.429 0.053 0.386 0.530.436 0.524 0.049 0.249 0.120.423 0.270
..
当我加载一个包时,我收到一条消息: "以下对象被 'package:xxx' 屏蔽 例如,如果我加载 testthat 然后 assertive,我得到以下信息: 库(testthat)图书馆(果断)## 附加包:'assertive'#### 以下对象被“package:testthat"屏蔽:#### has_names, is_false, is_less_than, is_null,
..
我刚刚读完关于 R 介绍中的范围界定,并且对
..
假设我们有一个数据框 x,其中包含列 job 和 income.引用框架中的数据通常需要命令 x$job 用于 job 列中的数据和 x$income 用于收入栏. 但是,使用命令 attach(x) 允许在引用相同数据时取消数据框的名称和 $ 符号.因此,在 R 代码中,x$job 变为 job,x$income 变为 income. 问题是许多 R 语言专家建议在 R 中编码时不要
..
假设我有 2 个源文件,第一个名为 example1.r,第二个名为 example2.r(如下所示). example1.r 情节(1:10,1:10) example2.r qplot(1:10,1:10) 当我获取 example1.r 时,会绘制图表.但是,当我获取 example2.r 时,它不会.这里的解决方案是什么? (example2.r中的qplot是ggpl
..
我在 Windows 上运行 R,而不是作为管理员.当我安装一个包时,以下命令不起作用: >install.packages("动物园")将软件包安装到“C:/Program Files/R/R-2.15.2/library"(因为“lib"未指定)install.packages 中的警告:'lib = "C:/Program Files/R/R-2.15.2/library"' 不可写 要
..
..
我终于能够计算出我的抓取的代码.它似乎工作正常,然后突然当我再次运行它时,我收到以下错误消息: url[i] 中的错误 = paste("http://en.wikipedia.org/wiki/", gsub(" ", "_", :“闭包"类型的对象不可子集 我不确定为什么,因为我的代码中没有任何更改. 请指教. 库(XML)图书馆(plyr)名称
..
在 Stack Overflow 和 在创建与 Shiny 相关的问题时也成立.总结一下:确保运行代码不需要额外的文件.使用像 mtcars 这样的示例数据集,或者使用 data.frame() 创建一些示例数据.如果您的数据非常复杂,并且确实需要这种复杂性来说明问题,您还可以使用 dput().避免使用像 read.csv() 这样的函数,当然除非你对像 fileInput 这样的函数有疑问.
..
我有一个数字向量: 数字 一个 一个数字4 5 23 34 43 54 56 65 67 324 435 453 456
..
..
我在 R 中有一个很大的性能问题.我编写了一个迭代 data.frame 对象的函数.它只是向 data.frame 添加一个新列并累积一些内容.(操作简单).data.frame 大约有 850K 行.我的电脑仍在工作(现在大约 10 小时),我不知道运行时间. dayloop2
..
..