r-faq相关内容
我已将 CSV 文件读入R data.frame。其中一列在其中一列具有相同的元素。我想删除该列中重复的行。例如: platform_external_dbus 202 16 google 1 platform_external_dbus 202 16 space-ghost.verbum 1 platform_external_dbus 202 16 localhost 1
..
我想在 dplyr 的函数中使用变量名作为字符串。请参见下面的示例: df
..
我想使用 dplyr的 mutate()在数据框中创建多个新列。列名称及其内容应动态生成。 来自虹膜的示例数据: code> require(dplyr) data(iris) iris
..
当我尝试以下列格式解析时间戳时:“Thu Nov 8 15:41:45 2012”,只返回 NA 。 我使用的是Mac OS X,R 2.15.2和Rstudio 0.97.237。我的操作系统的语言是荷兰语:我认为这与它有关系。 当我尝试 strptime , NA 返回: var
..
客户向我发送了3月15日格式为例如3/15/2012的Excel文件。我保存为.csv文件,然后使用 camm $ Date
..
我正在尝试将字符串“2013-JAN-14”转换成如下日期: sdate1
..
我有一个数据集,如下所示: 月份数 2009-01 12 2009-02 310 2009-03 2379 2009-04 234 2009-05 14 2009-08 1 2009-09 34 2009- 10 2386 我想绘制数据(月份为x值并计为y值)。由于数据存在差距,我希望将本月的信息转换为日期。我试过: as.Date(
..
什么时候应该使用 data.frame ,而最好使用矩阵? p> 两者都保留矩形格式的数据,所以有时候还不清楚。 是否有任何一般的经验法则使用哪些数据类型? 解决方案 部分答案已经包含在您的问题中:如果列(变量) )可以被预期为不同类型(数字/字符/逻辑等)。矩阵用于相同类型的数据。 因此,如果您的数据具有相同的类型,则选择矩阵/数据框只会有问题。 答案取决于你将要
..
我有这样的数据,其中一些“名称”出现超过3次: df
..
我们假设我们有一个数据框架 x ,其中包含列 job 和收入。参考框架中的数据通常需要命令 x $ job 用于作业列和收入列中的数据的c $ c> x $收入 但是,使用命令 attach(x)可以取消数据框的名称,而 $ 符号当提及相同的数据时。因此, x $ job 成为工作和 x $收入在R代码中成为收入。 问题是,R中的许多专家建议不要使用 attach()在R编码时的命令。
..
我想根据 R data.frame 中的因子列添加一列手段。像这样: df1
..
我正在努力找到一个适当的函数,它将返回指定数量的随机取出的行,而不用从R语言的数据框中进行替换。任何人都可以帮助我吗? 解决方案 首先提供一些数据: > df = data.frame(matrix(rnorm(20),nrow = 10)) > df X1 X2 1 0.7091409 -1.4061361 2 -1.1334614 -0.1973846 3 2.3343
..
是否可以对不具有相同列列的两个数据帧进行绑定?我希望在绑定后保留不匹配的列。 我是R的新手,但认为必须有一个相当快速的方法。 非常感谢, Brock 解决方案 从包 plyr 中的rbind.fill 可能是您正在寻找的。
..
我想将数据框拆分成几个较小的数据框。这似乎是一个非常琐碎的问题,但是我找不到网页搜索的解决方案。 解决方案 您可能还想剪切数据帧变成任意数量的较小数据帧。在这里,我们切成两个数据框。 x = data.frame(num = 1:26,let = letters,LET = LETTERS) set.seed(10) split(x,sample(rep(1:2,13)))
..
我正在尝试编写一个函数来接受一个data.frame( x )和一个列它。该函数对x执行一些计算,之后返回另一个data.frame。我坚持使用最佳实践方法将列名称传递给函数。 两个最小例子 fun1 和 fun2 以下产生所需的结果,可以使用 x $ column $ c> max()为例。但是,两者都依赖于(至少对我)不满意的 调用 substitute()可能 eval() 需
..
我有一个类似于这样的大数据框: df df 潜水速度 1潜水1 0.80668490 2潜水1 0.53349584 3潜水2 0.07571784 4潜水2 0.39518628
..
我有一个数据框,我想计算每个组中的行数。我非常地使用聚合函数来计算数据如下: df2
..
使用与此相似的数据框: set.seed(100) df
..
我有一些我想从数据框中删除的列。我知道我们可以使用以下方式单独删除它们: df $ x 鉴于R的强大程度,我认为可能会比逐个删除每一列更好一些。 解决方案 您可以使用简单的名
..
我想删除所有列中包含 NA 的数据框中的行。下面是我的示例数据框。 基因hsap mmul mmus rnor cfam 1 ENSG00000208234 0 NA NA NA NA 2 ENSG00000199674 0 2 2 2 2 3 ENSG00000221622 0 NA NA NA NA 4 ENSG00000207604 0 NA NA 1 2 5 EN
..