dplyr相关内容

创建一个新列,该列是dplyr中特定列(按其名称选择)的总和

我的问题是如何在dplyr中创建一个新列,该列是一些特定列(按其名称选择)的总和。 例如,对于虹膜数据集,我创建了一个名为Petal的新列,它是Petal.Length和Petal.Width的总和。 iris %>% mutate(Petal = Petal.Length+Petal.Width) 现在假设我有一个包含20列的数据集,这些列的名称中包含“Petal”。我想创建一个“花瓣 ..
发布时间:2022-02-28 19:28:55 其他开发

汇总所有因素组合的观测数据

有时需要一个完整的数据框架,其中包含分组因素的所有组合的观察结果,即使原始数据中没有这些组合(即用NA数据填充这些空白)。 考虑使用mtcars的以下示例: mtcars %>% group_by(cyl, gear) %>% dplyr::summarise(N = n()) # A tibble: 8 x 3 # Groups: cyl [3] cyl gear ..
发布时间:2022-02-28 19:14:28 其他开发

Dplyr在指定位置变异新列

示例: a = c(10,20,30) b = c(1,2,3) c = c(4,5,6) d = c(7,8,9) df=data.frame(a,b,c,d) library(dplyr) df_1 = df %>% mutate(a1=sum(a+1)) 如何在“a”(或任何其他定义的位置)之后而不是末尾添加“A1”? 谢谢您。 推荐答案 可能对发现此问题的其 ..
发布时间:2022-02-28 19:12:57 其他开发

最小最大给定NA值R dplyr

我想知道我们对每个任务收取的最低和最高费用是多少,我正在评估的行数超过25万行。 我不知道为什么会给我NA值 Data Sample: # A tibble: 279,360 x 7 Job.ID Task.ID Task.Name Task.Minutes Task.BillableRa~ Task.Billable Task ..
发布时间:2022-02-26 22:06:40 其他开发

如何将多列添加到Tibble?

我要向Tibble添加多个空列。 新列的名称存储在“column nsToAdd”中 > columnsToAdd [1] "column1" "column2" "column3" "column4" "column5" 当我运行以下代码行时,. library(dplyr) someTibble ..
发布时间:2022-02-21 14:35:41 其他开发

波浪符号和点符号在dplyr中的含义

摘要 我正在阅读一篇article,主题是dplyr的跨函数。看一下第一个使用示例,我看到了以前从未见过的运算符的使用。我不知道它们本质上是dplyr的一部分,还是其他一些软件包的一部分。无论哪种方式,我都不理解它们在代码中的用法。 代码示例: starwars |> summarize(across(where(is.character), ~ length(unique(. ..
发布时间:2022-02-21 14:33:05 其他开发

R中的唯一行,考虑两列,无顺序

与我发现的问题不同,我想获得两列的唯一性,没有顺序. 我有一个df: df 在这种情况下,第 1 行和第 4 行是“重复",因为 b-a 与 b-a 相同. 我知道如何找到第 1 列和第 2 列的唯一性,但在这种方法下我会发现每一行都是唯一的. 解决方案 有很多方法可以做到这一点,这里有一个: unique(t(apply(df, 1, sort)))重复(t(应用(df ..
发布时间:2022-01-30 22:52:31 其他开发

使用字符串向量输入在 dplyr 中按多列分组

我正在尝试将我对 plyr 的理解转移到 dplyr,但我不知道如何按多列进行分组. # 使用无法硬编码的奇怪列名制作数据数据 = 数据帧(asihckhdoydkhxiydfgfTgdsx = 样本(字母[1:3],100,替换=真),a30mvxigxkghc5cdsvxvyv0ja = 样本(字母[1:3],100,替换=真),值 = rnorm(100))# 得到我们想要平均的列列 = ..
发布时间:2022-01-30 22:35:09 其他开发

如何使用 dplyr 选择每组中具有最大值的行?

我想用 dplyr 在每组中选择一个最大值的行. 首先我生成一些随机数据来显示我的问题 set.seed(1)df 在 plyr 中,我可以使用自定义函数来选择这一行. 库(plyr)ddply(df, .(A, B), function(x) x[which.max(x$value),]) 在 dplyr 中,我使用此代码来获取最大值,但不是具有最大值的行(在本例中为 C 列). ..
发布时间:2022-01-30 21:58:28 其他开发