tidyr相关内容

使用 R 折叠不同列中具有不同值的重复行

我有一个包含 500 个观测值的数据框,但在我的示例中只显示了 3 个.这些是在不同列中具有不同值的重复项(ID 列除外,其中包括重复的人员).我正在复制数据框的样子 (df) 以及处理后的样子 (df_new).这可能吗 ?数据框是 10 个变量,所以我不担心将它们“加倍".变量中的值是 a,b,c,d,0,''.然而,我在表格中让它们更通用. df 解决方案 对于已编辑的数据和根据修订 ..
发布时间:2021-09-07 19:32:13 其他开发

从单列创建多列并清理结果

我有一个这样的数据框: foo=data.frame(Point.Type = c("零起点","零起点","零起点","3000rpm_10%_13barG_Sdsdsa_1.0_ss_Pww","3000rpm_10%_13barG_Sdsdsa_1.0"Pws_s3000rpm_10%_13barG_Sdsdsa_1.0_ss_Pww","零停止","零启动"),Point.Value = ..
发布时间:2021-09-07 19:32:10 其他开发

仅当它是 R 中的特定字符时才替换字符串中的第 n 个字符

我将一系列调查作为 .csv 文件导入并合并到一个数据集中.问题是对于七个文件之一,一些变量的导入略有不同.数据集很大,我想找到一种方法来编写一个函数来运行给我带来麻烦的数据集. 在一些变量中,应该有一个点的时候有一个下划线.并非所有变量的格式都相同,但不正确的是,下划线始终是列名的第 6 个元素. 我希望 R 查找第 6 个元素,如果它是下划线,则用点替换它.下面是一个虚构的例子. ..
发布时间:2021-09-07 19:32:01 其他开发

根据条件收集变量 (R)

我正在阅读“R for Data Science"一书,并想根据条件(类似于选择)从数据集中“收集"几个变量.具体来说,我只想选择连续变量而不是分类变量. 如何在不手动指定变量的情况下完成此操作?下面不起作用... 图书馆(tidyverse)钻石 %>%收集(键,值,is.numeric(键)) 解决方案 我确信有更好的方法可以做到这一点,但 gather() 可以将列位置作为选择参 ..
发布时间:2021-09-07 19:31:53 其他开发

如果数据复杂,如何分离行

说实话,这个问题最初不是我的.这个问题促使我把它放在一个简化的案例中. 因此,我必须根据当前场景中的分隔符 ; 将输入到单元格(在列中)的数据分成单独的行.这可以使用 tidyr::separate_rows() 轻松完成.近列中的数据已经连接在一起.现在的问题,实际上有两个,是 - 可能有由 ; 分隔的文本,但可能在闭括号 () 内,例如(text_A;text_B) 是要保持连接而 ..
发布时间:2021-09-07 19:31:47 其他开发

如何将不同列的数据整理成一列

我担心我的标题没有准确反映我的问题.让我尽可能地解释我的问题.这是我的数据的一部分. pdpass begyr1 gvkey1 endyr1 begyr2 gvkey2 endyr2 begyr3 gvkey3 endyr3 begyr4 gvkey4 endyr4 begyr5 gvkey5 endyr5-16348 1991 26005 1993 1994 8852 1996 1997 37 ..
发布时间:2021-09-07 19:31:38 其他开发

将数据从长格式重新格式化为宽格式

如何将此数据重新格式化为宽格式? species val price设置 5.1 3设置 4.9 3设置 4.7 3设置 4.6 2 所需的输出: species val1 val2 val3 val4 price1 price2 price3 price4设置 5.1 4.9 4.7 4.6 3 3 3 2 我曾尝试从 tidyr 传播但没有成功. 解决方案 data.table ..
发布时间:2021-09-07 19:31:35 其他开发

如何在带有变量的 tidyr 中使用 gather_

我将 tidyr 与闪亮一起使用,因此需要在 tidyr 操作中使用动态值.但是我确实在使用gather_()时遇到了麻烦,我认为它是为这种情况设计的.下面的最小示例: 库(tidyr)df % 收集(测量,数量,v1: ..
发布时间:2021-09-07 19:31:26 其他开发

tidyr:Pivot_wider 用数据类型替换值

我有一个数据框,行和列中的变量都包含变量,因此我尝试使用数据透视宽整理数据.我的数据如下所示: head(df)# 小块:6 x 4州年 Var X1 阿拉巴马州 2001 阿巴拉契亚地区委员会 (ARC) 30480312 阿拉巴马州 2001 年国家和社区服务公司 (CNCS) 17658353 阿拉巴马州 2001 农业部 (USDA) 282530 ..
发布时间:2021-09-07 19:31:23 其他开发

如何在向量集上展开.grid 而不是单个元素

所以,我有以下四个向量 a1 我最终想要的是一个看起来像 的数据框 p1 p2 p3 p41 11 12 31 322 21 22 31 323 11 12 41 424 21 22 41 42 即两个 a 向量与两个 b 向量的所有可能组合. 我所做的是 ab 我最终得到的是 p1 p2 p3 p41 c(11 12) c(31 32)2 c(21 22) c(31 ..
发布时间:2021-09-07 19:31:20 其他开发

无法更改“gather"输出的列名不是默认名称

我正在尝试在 tidyr 包中使用 gather,但我无法更改默认名称的输出列名称.例如: df = data.frame(time = 1:100,a = 1:100,b = 101:200)df.long = df %>% gather("foo","bar",a:b)列名(df.long) 给我 [1]“时间"“变量"“值" 但不应该是 "time" "foo" "bar" 吗? ..
发布时间:2021-09-07 19:31:17 其他开发