tidyr相关内容

如何将多个变量的重复测量值传播为宽格式?

我正在尝试获取长格式的列并将它们扩展为宽格式,如下所示.我想通过我正在投资的数据处理工具使用 tidyr 来解决这个问题,但为了使这个答案更通用,请提供其他解决方案. 这是我所拥有的: 库(dplyr);图书馆(tidyr)set.seed(10)dat ..
发布时间:2022-01-30 22:31:15 其他开发

使用 pivot_longer 将水平格式改造成长格式

我正在尝试使用之前提供的相同代码将我的数据重塑为长格式而不是宽格式 link ,但是即使经过多次尝试修改 names_pattern = "(.*)_(pre|post.*)" 也不起作用;, 我的数据样本是 data1 这是使用的代码: 库(dplyr);库(tidyr);库(stringr)出 % pivot_longer(cols = -Serial_ID,na ..
发布时间:2022-01-22 21:36:58 其他开发

将值从宽更改为长:1) Group_By, 2) Spread/Dcast

我有一个电话号码名称列表,我想按名称对其进行分组,然后将它们从长格式变为宽格式,并在各列中填充电话号码 姓名电话号码约翰·多伊 0123456约翰·多伊 0123457约翰·多伊 0123458吉姆·多伊 0123459吉姆·多伊 0123450简·多伊 0123451吉尔·多伊 0123457姓名 Phone_Number1 Phone_Number2 Phone_Number3约翰·多伊 0 ..
发布时间:2022-01-13 19:36:21 其他开发

最后一个下划线后的分隔字符串

这确实是这个问题的重复r-split-string-using-tidyrseparate,但我无法使用 MWE目的,因为我不知道如何调整正则表达式.我基本上想要同样的东西,但在最后一个下划线之后拆分变量. 原因:我的数据中某些列针对相同的因子/类型多次显示.我想我可以将数据融合在类型字符串之前将值变量分开,然后将其再次展开为具有较少列的宽格式.我的问题是我的变量名有几个不同的下划线,我想学 ..
发布时间:2022-01-13 19:32:29 其他开发

data.table 相当于 tidyr::complete()

tidyr::complete() 将行添加到 data.frame 用于数据中缺失的列值的组合.示例: 库(dplyr)图书馆(tidyr)df %tidyr::完成(人,观察ID,填充 = 列表(值 = 0)) 产量 # A tibble: 4 × 3人员观察_id 值1 1 1 12 1 2 03 2 1 14 2 2 1 dfperson == 1 和 ..
发布时间:2022-01-13 18:48:27 其他开发

Tidyr 如何传播到发生次数

有一个这样的数据框 other=data.frame(name=c("a","b","a","c","d"),result=c("Y","N","Y","Y","N")) 如何在 tidyr 或其他函数中使用扩展函数来获取结果 Y 或 N 的计数作为这样的列标题 name Y N2 00 1 谢谢 解决方案 以下是解决方案的几种方法: 1) 使用库 dplyr,您可以简单地将 ..
发布时间:2021-12-30 15:51:03 其他开发

使用重复的行标识符传播

在这里之前已经有关于这个话题的问题,但是我仍在努力传播这一点.我希望每个 state 都有自己的温度值列. 这是我的数据的 dput().我称之为df structure(list(date = c("2018-01-21", "2018-01-21", "2018-01-20","2018-01-20", "2018-01-19", "2018-01-19", "2018-01-18", ..
发布时间:2021-12-23 12:57:00 其他开发

tidyr 扩展函数在期望紧凑向量时生成稀疏矩阵

我正在学习 dplyr,来自 plyr,我想从 xtabs 的输出生成(每组)列(每次交互). 简短总结:我得到了 A B1 NA不适用 2 我想要的时候 A B1 2 xtabs 数据如下所示: >xtabs(data=data.frame(P=c(F,T,F,T,F),A=c(F,F,T,T,T)))一个P 错误 正确错误 1 ​​2真 1 1 现在 do( 想要数据帧中的数 ..
发布时间:2021-12-23 12:56:09 其他开发

如何选择 R 数据框中两列的所有唯一组合?

我有一个相关矩阵,我将其放入数据框中,如下所示: row |变量 1 |var2 |科尔1 |一个 |乙 |0.62 |乙 |一个 |0.63 |一个 |C |0.44 |C |一个 |0.4 这些结果每行复制到 2 行,同时包含“var1"和“var2".我只需要一个,最好先使用较低的变量(例如第 1 行和第 3 行). 我一直在玩 dplyr 两个小时并阅读旧线程,但没有找到我需要的 ..
发布时间:2021-12-23 12:49:44 其他开发

tidyr中如何正确使用spread函数

如何更改下表中的内容: 类型名称 答案 nTypeA 苹果 是 5TypeA 苹果 10 号A型苹果DK 8TypeA 苹果 NA 20TypeA 橙色 是 6A型橙11号A型橙色DK 8TypeA 橙色 NA 23 更改为: 类型名称 是 否 DK NATypeA 苹果 5 10 8 20A型 橙色 6 11 8 23 我使用以下代码来获取第一个表. df_1 %相符() 然后我尝试 ..
发布时间:2021-12-23 12:39:36 其他开发

计算不同客户之间的常见物品集

我有关于客户和他们购买的不同产品的数据: 客户产品1 安1 乙1 C二维2 E2楼3A3 乙3D4A4 乙 我想检查哪些产品组同时出现在不同客户之间.我想获得不同长度的产品组合的数量.例如,产品组合 A 和 B 一起出现在三个不同的客户身上;产品组 A、B 和 C 出现在一个客户身上.对数据中所有 2 个或更多产品的所有不同集合,依此类推.类似的东西: 产品组号甲、乙、丙 1D、E、F 1甲 ..
发布时间:2021-12-23 12:37:28 其他开发

在 R 中解聚合/反向汇总/扩展数据集

我的数据如下所示: data("泰坦尼克号")df 如何对计数/频率进行解聚合或反向汇总并将数据集扩展回其原始的非计数观察状态? 例如,我希望 3rd, Male, Child, No 重复 35 次,1st, Women, Adult, Yes 重复 140 次,以此类推,以此类推.数据框. 提前致谢. 解决方案 没有包,我们可以根据给定的频率重复每一行: df2 ..
发布时间:2021-12-23 12:37:15 其他开发