tidyr相关内容

使用可变列数将长转换为宽

鉴于以下长格式的数据,我想创建一个宽数据集,每个 srdr_id 一行,每个 arm_name 单独列,如下所示. 所需的输出: srdr_id c1 c2 c3174212陶米米172612牛米 我试过 tidyr::spread 没有成功. dat ..
发布时间:2021-09-07 19:33:12 其他开发

使用文字 names_pattern 旋转多个列

我想pivot_longer() 我的数据框包含一个带有原始数据行号的列.考虑以下数据框: set.seed(0)df % mutate("row_id" = row_number())>dfa b c row_id1 0.8966972 0.5728534 0.8983897 12 0. ..
发布时间:2021-09-07 19:33:09 其他开发

将嵌套数据框展开到父级

我有一个数据帧嵌套在我从 Mongo 获取的数据帧中.每行的行数匹配,因此在查看时它看起来像一个典型的数据帧.我的问题是,如何将嵌套的数据框扩展到父级中,以便我可以运行 dplyr 选择?看下面的布局 'data.frame':10 个观察.2个变量:$ _id : int 1551 1033 1061 1262 1032 1896 1080 1099 1679 1690$personalInf ..
发布时间:2021-09-07 19:33:03 其他开发

铸造(传播)多列字符向量的优雅解决方案

我想转换一个包含联系信息的数据框,其中包含类似信息的城市列表,例如电话号码出现在多列中. 我尝试使用 reshape2::dcast() 和 tidyr::spread(),这两种方法都不能解决我的问题.我还检查了堆栈溢出的其他帖子,例如 多列展开 尚未找到有效的解决方案.在我看来,这些问题应该相当简单(并且可以通过 spread 或 dcast 解决). tmp % # 同上 ..
发布时间:2021-09-07 19:33:00 其他开发

基于多列和多行条件扩展 R 数据框

我在 R studio 中有以下数据框 DF1 数据框由 5 列 - AN ID 列组成,用于标识每组和两组参数 - X_F、Y_F 和相应的一组 A 值 - X_A、Y_A. 数据框如下所示. X_F X_A Y_F Y_A ID1 0.1 2 0.2 安2 0.2 3 0.3 安3 0.3 5 0.4 安4 0.4 不适用 不适用5 0.5 7 0.7 安不适用 不适用 1 0 ..
发布时间:2021-09-07 19:32:58 其他开发

在 R 中将多列堆叠/熔化为多列

我正在尝试将数据帧的多个特定列融合/堆叠/收集到 2 列中,并保留所有其他列.我在stackoverflow上尝试了很多很多答案都没有成功(下面有一些).我基本上有一个类似于这篇文章的情况:重塑多组测量列(宽格式)成单列(长格式)只有更多的列要保留和组合.重要的是要提到我的年份列是因素,而且我的列比下面列出的示例多很多,所以我想称列名称而不是位置. >dfID Code Country year ..
发布时间:2021-09-07 19:32:53 其他开发

pivot_longer 和 pivot_wider 的问题

我正在尝试使用 pivot_longer 和 pivot_wider 并且它在独立脚本中运行良好.但是一旦我在闪亮中使用它,我就会收到以下错误: 警告:`value` 中的值不是唯一标识的;输出将包含列表列.* 使用 `values_fn = list(value = list)` 来抑制这个警告.* 使用 `values_fn = list(value = length)` 来识别重复出现的位 ..
发布时间:2021-09-07 19:32:48 其他开发

将一列数组转换为 R 中的单个值列

我有两列数组,我想将它们分配给各个单元格.例如,我的列目前看起来像这样: NDVI日期 [0.1,0.5,0.7] [1.54E12, 1.54E12, 1.54E12] 我如何才能将其重新格式化为: NDVI日期 0.1 1.54E12 0.5 1.54E12 0.7 1.54E12 以下是一些示例数据: DF< - 结构(列表(NDVIs = C(& ..
发布时间:2021-09-07 19:32:45 其他开发

tidyr 文档中的 pivot_longer 问题

我一直在关注 Tidyr 官方文档,试图刷新因为我有一段时间没有使用它了. 涉及 billboard 数据集的示例之一产生以下错误: 库(tidyr)广告牌 %>%枢轴更长(cols = starts_with("wk"),names_to = "周",names_prefix = "wk",names_transform = list(week = as.integer),values_ ..
发布时间:2021-09-07 19:32:42 其他开发

标题卡在行中的整理和转换数据

demodf 我想将 tidyr::spread 或 reshape2::dcast 转换为宽格式,其中 Field 成为列标题. 该代码看起来像 dcast(demodf, name ~ Values) 或 demodf %>% spread(Field, Values).但是,dcast 强制转换为数字,spread 会抛出错误. 问题是“标题"重复了.您可以看到,由于数据中的 ..
发布时间:2021-09-07 19:32:39 其他开发

如何规避 table() 函数抛出的 2^31 错误?

我真的尽我最大的努力通过 stackoverflow 搜索解决方案,但不幸的是我找不到合适的问题.因此,我必须自己提出一个问题. 我正在处理一个包含 sessionID 和主题的数据集.我想知道,有多少特定主题的物品被一起购买.值得庆幸的是,堆栈溢出成员有一个好主意,它使用了 table() 函数和 crossprod() 函数的组合. topicPairs ..
发布时间:2021-09-07 19:32:36 其他开发

如何计算列中的值并将它们与特定行匹配?

我有一个看起来像这样的数据集,其中 ID 和电子邮件对应于一个唯一的人.其余列代表由该人/行命名的人.例如,ID 为 1 且电子邮件地址为 alex@gmail.com 的人在被问到问题时名为 Pete、Jane 和 Tim. id 电子邮件 john_b alex_a pete jane tim1 alex@gmail.com 不适用 不适用 1 1 12 pete@yahoo.com 不适用 ..
发布时间:2021-09-07 19:32:33 其他开发

R/tidyr::complete - 动态填充缺失值

我正在使用 tidyr::complete() 在具有多列的数据框中包含缺失的行,从而导致 NAs 值.如果我没有明确的列名列表,如何指示 fill 选项将 NA 值替换为 0? 示例: df 一种解决方法是使用 df.complete[is.na(df.complete)] %收集(“v ..
发布时间:2021-09-07 19:32:30 其他开发

tidyr:每个键收集两个值

我有一个数据集,其中每个变量的均值和标准差作为列,但我想将其转换为“长"格式: 图书馆(tidyverse)虹膜%>%group_by(物种)%>%汇总_所有(列表(平均值 = 平均值,标准差 = 标准差))#># 小费:3 x 9#>物种 Sepal.Length_me~ Sepal.Width_mean Petal.Length_me~#>#>1 se ..
发布时间:2021-09-07 19:32:27 其他开发

dplyr 和 tidyr:将长格式转换为宽格式并排列列

我正在创建一个 shiny 应用,用户将在其中上传一个包含多个变量的 .csv 文件.使用dplyr,我将select 前四个变量,如下所示,并将它们从长格式转换. 数据 df 我使用下面的代码将长格式转换为宽格式 从长到宽 库(dplyr)图书馆(整理)df_wide %tidyr::spread(因子,功率) 结果 >df_wide客户评价 TK1 TK10 ..
发布时间:2021-09-07 19:32:24 其他开发

收集四列的值在两个键中

有人问过类似的问题,但它们都是指将多个列收集到一个关键列中. 我需要两个键中的多个列. 这是我拥有的数据框: ID ... measure_A.1 measure_A.2 measure_B.1 measure_B.21 8.25 23.5 4 52 8.6 22.5 3 4 如果我使用以下代码,我会得到这个: df %>%收集(键=measure_A,值=“score_A ..
发布时间:2021-09-07 19:32:18 其他开发