r-faq相关内容

ggplot 的 qplot 不执行采购

假设我有 2 个源文件,第一个名为 example1.r,第二个名为 example2.r(如下所示). example1.r plot(1:10,1:10) example2.r qplot(1:10,1:10) 当我获取example1.r时,绘制了图形.但是,当我获取 example2.r 时,它不会.这里的解决方案是什么? (example2.r中的qplot是ggpl ..
发布时间:2021-12-01 20:37:51 其他开发

将所有 0 值替换为 NA

我有一个包含一些数字列的数据框.某些行的值为 0,在统计分析中应将其视为空值.在 R 中将所有 0 值替换为 NULL 的最快方法是什么? 解决方案 将所有零替换为 NA: df[df == 0] 说明 1. 这不是 NULL 你应该用什么来替换零.正如它在 ?'NULL' 中所说, NULL 代表 R 中的空对象 这是独一无二的,我猜它可以被视为最缺乏信息和空洞的 ..
发布时间:2021-12-01 20:37:10 其他开发

如何删除所有重复项,以便 NONE 留在数据框中?

有一个类似的问题 用于 PHP,但我正在使用 R 并且无法将解决方案转化为我的问题. 我有一个 10 行 50 列的数据框,其中一些行完全相同.如果我在它上面使用 unique ,我会得到一行 - 比方说 - “type",但我真正想要的是只获取那些只出现一次的行.有谁知道我怎样才能做到这一点? 我可以查看集群和热图以手动对其进行排序,但我的数据框比上面提到的大(最多 100 行),这 ..
发布时间:2021-12-01 20:35:50 其他开发

只读取选定的列

谁能告诉我如何仅读取以下数据的前 6 个月(7 列),例如使用 read.table()? 年份 Jan Feb Mar Apr May Jun Jul Aug Sep Oct Nov Dec2009 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -252010 -41 -27 -25 -31 -31 -39 -25 -15 -30 -27 -21 -2 ..
发布时间:2021-12-01 20:35:26 其他开发

添加包含整数列的分箱值的列

我有一个包含几列的数据框,其中一列是等级,一个介于 1 和 20 之间的整数.我想创建另一个包含 bin 值(如“1-4"、“5-10")的列,“11-15"、“16-20". 最有效的方法是什么? 我拥有的数据框看起来像这样(.csv 格式): 等级、名称、信息1,史蒂夫,红3、乔、蓝6、约翰、格林3,丽兹,黄色15,乔恩,粉红色 我想向数据框中添加另一列,所以它会是这样的: ..
发布时间:2021-12-01 20:34:49 其他开发

<我的代码>中的错误: 'closure' 类型的对象不是子集的

我终于能够计算出我的抓取的代码.它似乎工作正常,然后突然当我再次运行它时,我收到以下错误消息: url[i] = paste("http://en.wikipedia.org/wiki/", gsub(" ", "_", :“闭包"类型的对象不是可子集的 我不知道为什么,因为我没有对代码进行任何更改. 请指教. 库(XML)图书馆(plyr)名字 ..
发布时间:2021-12-01 20:34:27 其他开发

require() 和 library() 有什么区别?

require() 和 library() 有什么区别? 解决方案 除了已经给出的好建议,我还要补充一点: 最好避免使用 require() 除非您实际上将使用它返回的值,例如在某些错误检查循环中,例如由 thierry 给出. 在大多数其他情况下,最好使用 library(),因为如果包不可用,这将在包加载时给出错误消息.如果包不存在,require() 只会失败而不会出错. ..
发布时间:2021-12-01 20:32:22 其他开发

在 R 中的同一图中绘制两个图

我想在同一个图中绘制 y1 和 y2. x 但是当我这样做时,它们不会一起绘制在同一个图中. 在 Matlab 中可以做 hold on,但有没有人知道如何在 R 中做到这一点? 解决方案 lines() 或 points() 将添加到现有图形,但不会创建新窗户.所以你需要做 plot(x,y1,type="l",col="red")线(x,y2,col =“绿色") ..
发布时间:2021-12-01 20:32:13 其他开发

strptime、as.POSIXct 和 as.Date 返回意外的 NA

当我尝试解析以下格式的时间戳时:“Thu Nov 8 15:41:45 2012",仅返回 NA. 我使用的是 Mac OS X、R 2.15.2 和 Rstudio 0.97.237.我的操作系统的语言是荷兰语:我想这与它有关. 当我尝试 strptime 时,返回 NA: var C 语言环境中,它们必须是前三个英文名称的大写字母:" “如果您想使用,了解缩写是必不可少的%a、 ..
发布时间:2021-12-01 20:31:56 其他开发

如何调用具有同名字符变量的对象

我正在尝试在 R 中编写一个函数,以类似的方式批量分析多个文件.这些文件属于 ExpressionSetIllumina 类.我可以使用目录中所有文件的名称制作一个字符(字符串)向量并加载每个文件: list = list.files()for (i in list[1]) {负载(一)} 这可以正确加载文件 >ls()[1] "i" "list" "SSD.BA.vsn">类(SSD.BA ..
发布时间:2021-12-01 20:31:18 其他开发

如何将包含多个文件的 Shiny 应用程序转换为易于共享和重现的 Shiny 示例?

在 Stack Overflow 和 在创建与 Shiny 相关的问题时也适用.总结一下:确保不需要额外的文件来运行你的代码.使用像 mtcars 这样的示例数据集,或者使用 data.frame() 创建一些示例数据.如果您的数据非常复杂并且确实需要这种复杂性来说明问题,您还可以使用 dput().避免使用像 read.csv() 这样的函数,除非你对像 fileInput 这样的函数有疑问. ..
发布时间:2021-12-01 20:31:09 其他开发

在 R 中格式化小数位

我有一个数字,例如 1.128347132904321674821,我想在输出到屏幕(或写入文件)时只显示两位小数.如何做到这一点? x 编辑: 使用: options(digits=2) 已被建议作为可能的答案.有没有办法在脚本中指定它以供一次性使用?当我将它添加到我的脚本中时,它似乎并没有做任何不同的事情,而且我对大量重新键入以格式化每个数字不感兴趣(我正在自动化一个非常大的报 ..
发布时间:2021-12-01 20:30:41 其他开发

计算向量中具有 x 值的元素数量

我有一个数字向量: 数字 我如何让 R 计算一个值 x 在向量中出现的次数? 解决方案 你可以直接使用 table(): >一个 一种数字4 5 23 34 43 54 56 65 67 324 435 453 456 567 6572 1 2 2 1 1 2 1 2 1 3 1 1 1 1 然后您可以对其进行子集化: >a[名称(a)==435]4353 ..
发布时间:2021-12-01 20:30:26 其他开发

当某些数字包含逗号作为千位分隔符时如何读取数据?

我有一个 csv 文件,其中一些数值用逗号作为千位分隔符的字符串表示,例如"1,513" 而不是 1513.将数据读入 R 的最简单方法是什么? 我可以使用 read.csv(..., colClasses="character"),但是在将这些列转换为数字之前,我必须从相关元素中去除逗号,然后我找不到一种巧妙的方法来做到这一点. 解决方案 我想使用 R 而不是预处理数据,因为它在修 ..
发布时间:2021-12-01 20:30:02 其他开发

如何从源代码安装 R 包?

一位朋友给我发送了关于 用 R 抓取纽约时报.我真的很想尝试一下.但是,第一步是从源代码安装一个名为 RJSONIO 的包. 我相当了解 R,但我不知道如何从源代码安装软件包. 我运行的是 Mac OSX. 解决方案 如果你有本地文件,那么使用 install.packages() 并设置 repos=NULL>: install.packages(path_to_file, ..
发布时间:2021-12-01 20:29:39 其他开发

如何使用变量在ggplot中指定列名

我有一个 ggplot 命令 ggplot(rates.by.groups, aes(x=name, y=rate, colour=majr, group=majr) ) 在函数内部.但我希望能够使用函数的参数来挑选要用作颜色和组的列.IE.我想要这样的东西 f 这样ggplot中使用的列是由参数决定的.例如.对于 f("majr") 我们得到了 的效果 ggplot(rates.b ..
发布时间:2021-12-01 20:28:36 其他开发

加速 R 中的循环操作

我在 R 中有一个很大的性能问题.我编写了一个函数来迭代 data.frame 对象.它只是向 data.frame 添加一个新列并累积一些东西.(操作简单).data.frame 大约有 850K 行.我的电脑仍在工作(现在大约 10 小时),我不知道运行时间. dayloop2 1) {if ((temp[i,6] == temp[i-1,6]) & (temp[i,3] == temp[ ..
发布时间:2021-12-01 20:27:45 其他开发