tidyr相关内容
我有一个包含 500 个观测值的数据框,但在我的示例中只显示了 3 个.这些是在不同列中具有不同值的重复项(ID 列除外,其中包括重复的人员).我正在复制数据框的样子 (df) 以及处理后的样子 (df_new).这可能吗 ?数据框是 10 个变量,所以我不担心将它们“加倍".变量中的值是 a,b,c,d,0,''.然而,我在表格中让它们更通用. df 解决方案 对于已编辑的数据和根据修订
..
我有一个这样的数据框: foo=data.frame(Point.Type = c("零起点","零起点","零起点","3000rpm_10%_13barG_Sdsdsa_1.0_ss_Pww","3000rpm_10%_13barG_Sdsdsa_1.0"Pws_s3000rpm_10%_13barG_Sdsdsa_1.0_ss_Pww","零停止","零启动"),Point.Value =
..
我正在尝试在 R 中重塑数据框: Gene_ID 值 Gene_ID.1 值.1 Gene_ID.2 值.21 A 0 A 3 A 12 乙 5 乙 6 乙 53 C 7 C 2 C 74 D 8 D 9 D 25 E 5 E 8 E 46 F 6 F 4 F 5 我想让它看起来像这样: Gene_ID 值1 02 乙 53 C 74 D 85 E 56 F 67 一 18 乙 59 C
..
我有用于公司数据的宽格式数据框 df_wide df_wide 并且我希望将数据转换为像 df_long 这样的长格式 df_long
..
我将一系列调查作为 .csv 文件导入并合并到一个数据集中.问题是对于七个文件之一,一些变量的导入略有不同.数据集很大,我想找到一种方法来编写一个函数来运行给我带来麻烦的数据集. 在一些变量中,应该有一个点的时候有一个下划线.并非所有变量的格式都相同,但不正确的是,下划线始终是列名的第 6 个元素. 我希望 R 查找第 6 个元素,如果它是下划线,则用点替换它.下面是一个虚构的例子.
..
我搜索并搜索了这个并找到了类似的东西,但没有什么是正确的.希望这还没有得到回答. 假设我有一列包含 Y、N,有时还有额外信息 df
..
我有这样的数据 n 我使用扩展函数使用以下函数分配公共字符串 库(tidyr)res
..
我正在阅读“R for Data Science"一书,并想根据条件(类似于选择)从数据集中“收集"几个变量.具体来说,我只想选择连续变量而不是分类变量. 如何在不手动指定变量的情况下完成此操作?下面不起作用... 图书馆(tidyverse)钻石 %>%收集(键,值,is.numeric(键)) 解决方案 我确信有更好的方法可以做到这一点,但 gather() 可以将列位置作为选择参
..
我有一个数据框如下: structure(list(symbol = c("u", "n", "v", "i", "a"), start = c(9L,6L, 10L, 8L, 7L), end = c(14L, 15L, 12L, 13L, 11L)), .Names = c("symbol","开始", "结束"), class = "data.frame", row.names = c("
..
说实话,这个问题最初不是我的.这个问题促使我把它放在一个简化的案例中. 因此,我必须根据当前场景中的分隔符 ; 将输入到单元格(在列中)的数据分成单独的行.这可以使用 tidyr::separate_rows() 轻松完成.近列中的数据已经连接在一起.现在的问题,实际上有两个,是 - 可能有由 ; 分隔的文本,但可能在闭括号 () 内,例如(text_A;text_B) 是要保持连接而
..
假设我有以下数据框: >a 一种来源:本地数据框 [3 x 2]my_type_1_num_widgets my_type_2_num_widgets1 1 42 2 53 3 6 我想做两件事: 收集“num_wid
..
我想用 Gather 功能整理我的数据,但如何一次指定多列? 说这是我的数据: Country Country.Code Year X0tot4 X5tot9 X10tot14 X15tot19 X20tot241 越南 704 1955 4606 2924 2389 2340 25022 越南 704 1960 5842 4410 2860 2356 23183 越南 704 1965
..
我担心我的标题没有准确反映我的问题.让我尽可能地解释我的问题.这是我的数据的一部分. pdpass begyr1 gvkey1 endyr1 begyr2 gvkey2 endyr2 begyr3 gvkey3 endyr3 begyr4 gvkey4 endyr4 begyr5 gvkey5 endyr5-16348 1991 26005 1993 1994 8852 1996 1997 37
..
如何将此数据重新格式化为宽格式? species val price设置 5.1 3设置 4.9 3设置 4.7 3设置 4.6 2 所需的输出: species val1 val2 val3 val4 price1 price2 price3 price4设置 5.1 4.9 4.7 4.6 3 3 3 2 我曾尝试从 tidyr 传播但没有成功. 解决方案 data.table
..
我想将向量中的每个字符串分成列,但我做不到! 库(tidyr)图书馆(dplyr)df % 分离(x,c(“A",“B",“C"),sep=1) 我想要的输出看起来像这样 A B C1个2 秒3 d d s4 er 那个 sep=1 对 2 个字符有效,但对 3 个字符无效.我希望像
..
我正在尝试使用标准评估从 tidyr 包中排除 gather() 中的列. 使用非标准评估,这可以正常工作: mtcars_df
..
我将 tidyr 与闪亮一起使用,因此需要在 tidyr 操作中使用动态值.但是我确实在使用gather_()时遇到了麻烦,我认为它是为这种情况设计的.下面的最小示例: 库(tidyr)df % 收集(测量,数量,v1:
..
我有一个数据框,行和列中的变量都包含变量,因此我尝试使用数据透视宽整理数据.我的数据如下所示: head(df)# 小块:6 x 4州年 Var X1 阿拉巴马州 2001 阿巴拉契亚地区委员会 (ARC) 30480312 阿拉巴马州 2001 年国家和社区服务公司 (CNCS) 17658353 阿拉巴马州 2001 农业部 (USDA) 282530
..
所以,我有以下四个向量 a1 我最终想要的是一个看起来像 的数据框 p1 p2 p3 p41 11 12 31 322 21 22 31 323 11 12 41 424 21 22 41 42 即两个 a 向量与两个 b 向量的所有可能组合. 我所做的是 ab 我最终得到的是 p1 p2 p3 p41 c(11 12) c(31 32)2 c(21 22) c(31
..
我正在尝试在 tidyr 包中使用 gather,但我无法更改默认名称的输出列名称.例如: df = data.frame(time = 1:100,a = 1:100,b = 101:200)df.long = df %>% gather("foo","bar",a:b)列名(df.long) 给我 [1]“时间"“变量"“值" 但不应该是 "time" "foo" "bar" 吗?
..