tidyr相关内容
鉴于以下长格式的数据,我想创建一个宽数据集,每个 srdr_id 一行,每个 arm_name 单独列,如下所示. 所需的输出: srdr_id c1 c2 c3174212陶米米172612牛米 我试过 tidyr::spread 没有成功. dat
..
我想pivot_longer() 我的数据框包含一个带有原始数据行号的列.考虑以下数据框: set.seed(0)df % mutate("row_id" = row_number())>dfa b c row_id1 0.8966972 0.5728534 0.8983897 12 0.
..
挑战:我有一列有几行.例如,第一行是“水果名称",第二行是“水果颜色",对于另一个水果重复.我想抓取每隔一行(水果颜色)并创建一个新列.在原始列中只保留水果名称 图书馆(tidyverse)df_before
..
我有一个数据帧嵌套在我从 Mongo 获取的数据帧中.每行的行数匹配,因此在查看时它看起来像一个典型的数据帧.我的问题是,如何将嵌套的数据框扩展到父级中,以便我可以运行 dplyr 选择?看下面的布局 'data.frame':10 个观察.2个变量:$ _id : int 1551 1033 1061 1262 1032 1896 1080 1099 1679 1690$personalInf
..
我想转换一个包含联系信息的数据框,其中包含类似信息的城市列表,例如电话号码出现在多列中. 我尝试使用 reshape2::dcast() 和 tidyr::spread(),这两种方法都不能解决我的问题.我还检查了堆栈溢出的其他帖子,例如 多列展开 尚未找到有效的解决方案.在我看来,这些问题应该相当简单(并且可以通过 spread 或 dcast 解决). tmp % # 同上
..
我在 R studio 中有以下数据框 DF1 数据框由 5 列 - AN ID 列组成,用于标识每组和两组参数 - X_F、Y_F 和相应的一组 A 值 - X_A、Y_A. 数据框如下所示. X_F X_A Y_F Y_A ID1 0.1 2 0.2 安2 0.2 3 0.3 安3 0.3 5 0.4 安4 0.4 不适用 不适用5 0.5 7 0.7 安不适用 不适用 1 0
..
我正在尝试将数据帧的多个特定列融合/堆叠/收集到 2 列中,并保留所有其他列.我在stackoverflow上尝试了很多很多答案都没有成功(下面有一些).我基本上有一个类似于这篇文章的情况:重塑多组测量列(宽格式)成单列(长格式)只有更多的列要保留和组合.重要的是要提到我的年份列是因素,而且我的列比下面列出的示例多很多,所以我想称列名称而不是位置. >dfID Code Country year
..
假设我有一个 data.frame 如下: data = data.frame(firm = LETTERS[seq(from = 1, to = 9)],行业 = seq(1,9),country = c("USA", "CAN", "DEU"),var1_10 = norm(9),var1_11 = norm(9),var1_12 = norm(9),var2_10 = norm(9),va
..
我正在尝试使用 pivot_longer 和 pivot_wider 并且它在独立脚本中运行良好.但是一旦我在闪亮中使用它,我就会收到以下错误: 警告:`value` 中的值不是唯一标识的;输出将包含列表列.* 使用 `values_fn = list(value = list)` 来抑制这个警告.* 使用 `values_fn = list(value = length)` 来识别重复出现的位
..
我有两列数组,我想将它们分配给各个单元格.例如,我的列目前看起来像这样: NDVI日期 [0.1,0.5,0.7] [1.54E12, 1.54E12, 1.54E12] 我如何才能将其重新格式化为: NDVI日期 0.1 1.54E12 0.5 1.54E12 0.7 1.54E12 以下是一些示例数据: DF< - 结构(列表(NDVIs = C(&
..
我一直在关注 Tidyr 官方文档,试图刷新因为我有一段时间没有使用它了. 涉及 billboard 数据集的示例之一产生以下错误: 库(tidyr)广告牌 %>%枢轴更长(cols = starts_with("wk"),names_to = "周",names_prefix = "wk",names_transform = list(week = as.integer),values_
..
demodf 我想将 tidyr::spread 或 reshape2::dcast 转换为宽格式,其中 Field 成为列标题. 该代码看起来像 dcast(demodf, name ~ Values) 或 demodf %>% spread(Field, Values).但是,dcast 强制转换为数字,spread 会抛出错误. 问题是“标题"重复了.您可以看到,由于数据中的
..
我真的尽我最大的努力通过 stackoverflow 搜索解决方案,但不幸的是我找不到合适的问题.因此,我必须自己提出一个问题. 我正在处理一个包含 sessionID 和主题的数据集.我想知道,有多少特定主题的物品被一起购买.值得庆幸的是,堆栈溢出成员有一个好主意,它使用了 table() 函数和 crossprod() 函数的组合. topicPairs
..
我有一个看起来像这样的数据集,其中 ID 和电子邮件对应于一个唯一的人.其余列代表由该人/行命名的人.例如,ID 为 1 且电子邮件地址为 alex@gmail.com 的人在被问到问题时名为 Pete、Jane 和 Tim. id 电子邮件 john_b alex_a pete jane tim1 alex@gmail.com 不适用 不适用 1 1 12 pete@yahoo.com 不适用
..
我正在使用 tidyr::complete() 在具有多列的数据框中包含缺失的行,从而导致 NAs 值.如果我没有明确的列名列表,如何指示 fill 选项将 NA 值替换为 0? 示例: df 一种解决方法是使用 df.complete[is.na(df.complete)] %收集(“v
..
我有一个数据集,其中每个变量的均值和标准差作为列,但我想将其转换为“长"格式: 图书馆(tidyverse)虹膜%>%group_by(物种)%>%汇总_所有(列表(平均值 = 平均值,标准差 = 标准差))#># 小费:3 x 9#>物种 Sepal.Length_me~ Sepal.Width_mean Petal.Length_me~#>#>1 se
..
我正在创建一个 shiny 应用,用户将在其中上传一个包含多个变量的 .csv 文件.使用dplyr,我将select 前四个变量,如下所示,并将它们从长格式转换. 数据 df 我使用下面的代码将长格式转换为宽格式 从长到宽 库(dplyr)图书馆(整理)df_wide %tidyr::spread(因子,功率) 结果 >df_wide客户评价 TK1 TK10
..
我有以下与 cp11 相关的错误.cp11编译好像有错误,不知道怎么解决. 我尝试做的是卸载软件包并重新安装. 我使用的是 RHEL 7,gcc 版本是 4.8.5 >install.packages(“tidyverse")安装包到‘/datascience/R/x86_64-redhat-linux-gnu-library/3.6’(因为'lib'未指定)还安装依赖项“tidyr
..
有人问过类似的问题,但它们都是指将多个列收集到一个关键列中. 我需要两个键中的多个列. 这是我拥有的数据框: ID ... measure_A.1 measure_A.2 measure_B.1 measure_B.21 8.25 23.5 4 52 8.6 22.5 3 4 如果我使用以下代码,我会得到这个: df %>%收集(键=measure_A,值=“score_A
..
如何使用 tidyr pivot_wide 将此数据框从长格式转换为宽形式?我尝试应用文档页面上的示例,但我一定遗漏了一些东西. 数据框 id id文件名val 1 file1a.txt 832 1 file1b.txt 834 2 file2a.txt 221 2 file2b.txt 878 3 file3a.txt 2 3 file3b.txt 19 期望输出
..