r-faq相关内容
..
当我需要过滤一个data.frame,即提取满足一定条件的行时,我更喜欢使用subset函数: subset(airquality, Month == 8 & Temp > 90) 而不是[函数: airquality[airquality$Month == 8 &空气质量$Temp >90, ] 我偏爱的主要原因有两个: 我发现代码从左到右读起来更好.即使对 R 一无所知的人也能知
..
是否可以行绑定两个没有相同列集的数据框?我希望保留绑定后不匹配的列. 解决方案 plyr 包中的rbind.fill 可能是您正在寻找的.
..
..
我想知道如何在 ggplot 上添加回归线方程和 R^2.我的代码是: 库(ggplot2)df 我们将不胜感激. 解决方案 这里有一个解决方案 # 将方程和 R 平方作为字符串# 来源:https://groups.google.com/forum/#!topic/ggplot2/1TgH-kG5XMAlm_eqn
..
我想删除此数据框中的以下行: a) 在所有列中包含 NA. 下面是我的示例数据框. 基因 hsap mmul mmus rnor cfam1 ENSG00000208234 0 NA NA NA NA2 ENSG00000199674 0 2 2 2 23 ENSG00000221622 0 NA NA NA NA4 ENSG00000207604 0 NA NA 1 25 ENSG00
..
..
我有许多要合并的 data.frames 的列表.这里的问题是每个 data.frame 在行数和列数方面都不同,但它们都共享关键变量(我称之为 "var1" 和 "var2" 在下面的代码中).如果 data.frames 在列方面相同,我只能 rbind,为此 plyr 的 rbind.fill 可以完成这项工作,但这些数据并非如此. 因为 merge 命令仅适用于 2 个 data.f
..
..
我有一个遵循以下长模式的数据框: 名称 MedName名称1 阿替洛尔25mg名称1 阿司匹林81mg名称1 西地那非 100mg名称2 阿替洛尔 50mg名称2 依那普利 20mg 并且想得到下面(我不在乎我是否可以这样命名列,只想要这种格式的数据): 命名药物1 药物2 药物3名称1 阿替洛尔 25mg 阿司匹林 81mg 西地那非 100mg名称2 阿替洛尔 50mg 依那普利 2
..
我正在尝试制作一个条形图,其中最大的条形图最接近 y 轴,最短的条形图最远.所以这有点像我的表 名称 位置1 詹姆斯守门员2 弗兰克守门员3 让防御4史蒂夫防守5 约翰防御6 蒂姆·前锋 所以我正在尝试构建一个条形图,根据位置显示玩家数量 p 但图表首先显示的是守门员栏,然后是防守栏,最后是前锋栏.我希望对图表进行排序,以便防守条最接近 y 轴,守门员最接近,最后是前锋.谢谢 解
..
我想根据两个分组变量聚合数据框中的一列,并用逗号分隔各个值. 这是一些数据: data “A"和“B"是分组变量,“C"是我想折叠成逗号分隔的character字符串的变量.我试过了: 库(plyr)ddply(数据,.(A,B),总结,测试=列表(C))A B 测试1 111 1 5, 72 111 2 63 222 1 94 222 2 8, 10 但是当我尝试将测试列转换为
..
将我的 data.frame 从宽表转换为长表时遇到了一些麻烦.目前它看起来像这样: 代码国家/地区 1950 1951 1952 1953 1954AFG 阿富汗 20,249 21,352 22,532 23,557 24,555ALB 阿尔巴尼亚 8,097 8,986 10,058 11,123 12,246 现在我想把这个 data.frame 转换成一个长的 data.frame.
..
这是一个向量 a
..
从数据框中,有没有一种简单的方法可以同时聚合(sum、mean、max 等)多个变量? 以下是一些示例数据: 库(lubridate)天数 = 365*2date = seq(as.Date("2000-01-01"), length = days, by = "day")年 = 年(日期)月 = 月(日期)x1 = cumsum(rnorm(天, 0.05))x2 = cumsum(rn
..
我有这个错误: 'someFunction' 不是从 'namespace:somePackage' 导出的对象 有人知道怎么解决吗? 解决方案 一些原因: 函数不再是包的一部分,请尝试??someFunction找出它属于哪个包. 包数据不是包的一部分 该功能在较新版本的软件包中可用,请重新安装最新版本. 另请参阅有关此问题的具体实例的这些问题: 错误:
..
我想卸载一个包而不必重新启动 R(主要是因为在我尝试不同的、冲突的包时重新启动 R 会令人沮丧,但可以想象,这可以在程序中使用一个函数,然后使用另一个 -- 尽管命名空间引用可能是一个更好的主意). ?library 没有显示任何可以卸载包的选项. 有一个 建议 detach 可以卸载包,但是下面两个都失败了: 分离(素食主义者) detach(vegan) 错误:name 参数无
..
我尝试安装一个包,使用 install.packages("foobarbaz") 但收到警告 警告信息:包 'foobarbaz' 不可用(对于 R 版本 x.y.z) 为什么 R 不认为包可用? 另请参阅有关此问题的具体实例的这些问题: 我的包不适用于 R 2.15.2 包'Rbbg'不可用(对于R版本 2.15.2) 包不可用(对于 R 版本 2.15.2) 包 d
..
一个非常新的问题,但假设我有这样的数据: test_data
..
有一个类似问题 对于 PHP,但我正在使用 R 并且无法将解决方案转换为我的问题. 我有这个包含 10 行和 50 列的数据框,其中一些行完全相同.如果我在它上面使用唯一的,我会得到一行 - 比如说 - “类型",但我真正想要的是只得到那些只出现一次的行.有谁知道我如何做到这一点? 我可以查看集群和热图以手动对其进行排序,但我的数据框比上面提到的更大(最多 100 行),这有点棘手.
..