dplyr 第6页 - IT屋-程序员软件开发技术分享社区

创建一个新列，该列是dplyr中特定列(按其名称选择)的总和

我的问题是如何在dplyr中创建一个新列，该列是一些特定列(按其名称选择)的总和。例如，对于虹膜数据集，我创建了一个名为Petal的新列，它是Petal.Length和Petal.Width的总和。 iris %>% mutate(Petal = Petal.Length+Petal.Width) 现在假设我有一个包含20列的数据集，这些列的名称中包含“Petal”。我想创建一个“花瓣 ..

发布时间：2022-02-28 19:28:55 r dplyr tidyverse 其他开发

将向量添加到数据。在R中以非对称方式帧

在下面的代码中，我想知道是否可以将z1向量添加到data.framed1，以便我们可以使用Base R或tidyverse实现Desired_Output？这是一个玩具示例。因此，d1可以有任意数量的行和列，z1向量可以有任意数量的元素。因此，高度赞赏适用于其他数据框架的功能答案。 d1 ..

发布时间：2022-02-28 19:17:53 r dataframe function dplyr tidyverse 其他开发

根据列值腐蚀性减去嵌套在数据框中的行

对于study的每个唯一值，我想知道如何从interval_id中相应的yi具有group != "C"的group == "C"行中减去group == "C"行的group == "C" 例如，在study == 1中，interval_id == 0的group == "C"的yi == .4应该从group == "T1"的yi == .1中减去。同样，在study == 1中， ..

发布时间：2022-02-28 19:15:56 r dataframe function dplyr tidyverse 其他开发

汇总所有因素组合的观测数据

有时需要一个完整的数据框架，其中包含分组因素的所有组合的观察结果，即使原始数据中没有这些组合(即用NA数据填充这些空白)。考虑使用mtcars的以下示例： mtcars %>% group_by(cyl, gear) %>% dplyr::summarise(N = n()) # A tibble: 8 x 3 # Groups: cyl [3] cyl gear ..

发布时间：2022-02-28 19:14:28 r dplyr tidyverse 其他开发

Dplyr在指定位置变异新列

示例： a = c(10,20,30) b = c(1,2,3) c = c(4,5,6) d = c(7,8,9) df=data.frame(a,b,c,d) library(dplyr) df_1 = df %>% mutate(a1=sum(a+1)) 如何在“a”(或任何其他定义的位置)之后而不是末尾添加“A1”？谢谢您。推荐答案可能对发现此问题的其 ..

发布时间：2022-02-28 19:12:57 r dplyr tidyverse 其他开发

合并两个数据帧会在R中创建额外的行

我有两个数据帧。 a=包含数千个不同天气事件观测的原始数据集。6000个OBS。 STATE EVTYPE 1 AL WINTER STORM 2 AL TORNADO 3 AL TSTM WIND 4 AL TSTM WIND 5 AL TSTM WIND 6 AL HAIL ..

发布时间：2022-02-28 18:59:51 r join merge left-join dplyr 其他开发

最小最大给定NA值R dplyr

我想知道我们对每个任务收取的最低和最高费用是多少，我正在评估的行数超过25万行。我不知道为什么会给我NA值 Data Sample: # A tibble: 279,360 x 7 Job.ID Task.ID Task.Name Task.Minutes Task.BillableRa~ Task.Billable Task ..

发布时间：2022-02-26 22:06:40 r dplyr max min na 其他开发

识别和计算咒语(每组中的不同事件)

我正在寻找一种有效的方法来识别时间序列中的法术/符文。在下图中，前三列是我拥有的，第四列spell是我要计算的。我已尝试使用dplyr的lead和lag，但这太复杂了。我尝试了rle，但一无所获。 ReprEx df ..

发布时间：2022-02-23 19:10:24 r dataframe dplyr time-series grouping 其他开发

dplyr组不使用美元符号数据$COLUMN语法

我要查找每个组的列的最小值和最大值： mtcars %>% group_by(mtcars$cyl) %>% summarize( min_mpg = min(mtcars$mpg), max_mpg = max(mtcars$mpg) ) # # A tibble: 3 x 3 # `mtcars$cyl` min_mpg max_mpg # ..

发布时间：2022-02-21 22:47:39 r dplyr group-by summarize r-faq 其他开发

如何将多列添加到Tibble？

我要向Tibble添加多个空列。新列的名称存储在“column nsToAdd”中 > columnsToAdd [1] "column1" "column2" "column3" "column4" "column5" 当我运行以下代码行时，. library(dplyr) someTibble ..

发布时间：2022-02-21 14:35:41 r dplyr 其他开发

从数据场%2中的数据帧%1查找紧密匹配

我有两个数据帧，对于数据帧1中的每个特定行，我都在尝试根据定义的重要标准(移位、年龄、级别)从数据帧2中查找其最接近的匹配项。例如，假设我有数据帧1： shift_1 ..

发布时间：2022-02-21 14:34:24 r dataframe dplyr pattern-matching 其他开发

波浪符号和点符号在dplyr中的含义

摘要我正在阅读一篇article，主题是dplyr的跨函数。看一下第一个使用示例，我看到了以前从未见过的运算符的使用。我不知道它们本质上是dplyr的一部分，还是其他一些软件包的一部分。无论哪种方式，我都不理解它们在代码中的用法。代码示例： starwars |> summarize(across(where(is.character), ~ length(unique(. ..

发布时间：2022-02-21 14:33:05 r dplyr across 其他开发

将管道运算符%>；%与colames()<；-

如何使用管道运算符通过管道导入colnames()% summarise(mean(disp), mean(hp)) colnames(averages_df) ..

发布时间：2022-02-21 14:31:57 r dplyr magrittr 其他开发

dplyr中的过滤函数错误：找不到对象'；名称'；

我在R中有一个数据框，名为UK_profiles： row.names id name 1 1 8131437 Profile 2 2 8131719 WolverineCompetition 3 4 8132011 www.vaseline.com 4 10 23265829 www.keepingskinamazin ..

发布时间：2022-02-21 14:30:27 r dplyr 其他开发

对`dplyr`中的新列/变量使用动态名称

我要使用dplyr::mutate()在数据框中创建多个新列。应动态生成列名及其内容。虹膜数据示例： library(dplyr) iris ..

发布时间：2022-02-21 14:29:31 r dplyr r-faq 其他开发

R中的唯一行，考虑两列，无顺序

与我发现的问题不同，我想获得两列的唯一性，没有顺序. 我有一个df: df 在这种情况下，第 1 行和第 4 行是“重复"，因为 b-a 与 b-a 相同. 我知道如何找到第 1 列和第 2 列的唯一性，但在这种方法下我会发现每一行都是唯一的. 解决方案有很多方法可以做到这一点，这里有一个: unique(t(apply(df, 1, sort)))重复(t(应用(df ..

发布时间：2022-01-30 22:52:31 r unique plyr dplyr 其他开发

我正在尝试将我对 plyr 的理解转移到 dplyr，但我不知道如何按多列进行分组. # 使用无法硬编码的奇怪列名制作数据数据 = 数据帧(asihckhdoydkhxiydfgfTgdsx = 样本(字母[1:3]，100，替换=真)，a30mvxigxkghc5cdsvxvyv0ja = 样本(字母[1:3]，100，替换=真)，值 = rnorm(100))# 得到我们想要平均的列列 = ..

发布时间：2022-01-30 22:35:09 r dplyr r-faq 其他开发

为什么我的 dplyr group_by &总结不能正常工作?(名称与 plyr 冲突)

我有一个如下所示的数据框: #dfID 喂药 AUC0t Tmax Cmax1 1 0 100 5 202 1 1 200 6 253 0 1 不适用 2 304 0 0 150 6 65 以此类推.我想通过药物 DRUG 和 FED STATUS FED 总结一些关于 AUC、Tmax 和 Cmax 的统计数据.我使用 dplyr.例如:对于 AUC: CI90lo %总结(平均值=平均值 ..

发布时间：2022-01-30 22:04:03 r plyr dplyr shadowing name-collision 其他开发

按组将缺失值 (NA) 替换为最近的非 NA

..

发布时间：2022-01-30 22:02:46 r dplyr 其他开发

如何使用 dplyr 选择每组中具有最大值的行?

我想用 dplyr 在每组中选择一个最大值的行. 首先我生成一些随机数据来显示我的问题 set.seed(1)df 在 plyr 中，我可以使用自定义函数来选择这一行. 库(plyr)ddply(df, .(A, B), function(x) x[which.max(x$value),]) 在 dplyr 中，我使用此代码来获取最大值，但不是具有最大值的行(在本例中为 C 列). ..

发布时间：2022-01-30 21:58:28 r dplyr plyr greatest-n-per-group 其他开发

dplyr相关内容