tidyr相关内容
我正在尝试使用pivot wider创建包含值的多个列/变量,但我不应该使用这些列。 以下是具有代表性的数据样本: df
..
我有以下数据框: library(tidyverse) dat
..
此问题与此问题相关dplyr median by group 并已在此处回答:pivot_longer with multiple classes causes error ("No common type") 现在我了解到我们应该使用values_transform而不是values_ptypes。 我想知道这是什么原因?是否有更深层次的原因导致values_ptypes不起作
..
我正在尝试获取长格式的列并将它们扩展为宽格式,如下所示.我想通过我正在投资的数据处理工具使用 tidyr 来解决这个问题,但为了使这个答案更通用,请提供其他解决方案. 这是我所拥有的: 库(dplyr);图书馆(tidyr)set.seed(10)dat
..
我正在尝试使用之前提供的相同代码将我的数据重塑为长格式而不是宽格式 link ,但是即使经过多次尝试修改 names_pattern = "(.*)_(pre|post.*)" 也不起作用;, 我的数据样本是 data1 这是使用的代码: 库(dplyr);库(tidyr);库(stringr)出 % pivot_longer(cols = -Serial_ID,na
..
继续我之前的 post,我现在还有 1 列 ID 值,我需要使用这些值将行转换为列. NUM
..
我有一个长格式数据框狗,我正在尝试使用 reshape() 函数将其重新格式化为宽格式.目前看起来是这样的: dogid 月年 trainingtype 家庭学校 timeincomp12345 1 2014 1 1 1 34012345 2 2014 1 1 1 36031323 12 2015 2 7 3 44031323 1 2014 1 7 3 50031323 2 2014 1 7 3
..
我有一个电话号码名称列表,我想按名称对其进行分组,然后将它们从长格式变为宽格式,并在各列中填充电话号码 姓名电话号码约翰·多伊 0123456约翰·多伊 0123457约翰·多伊 0123458吉姆·多伊 0123459吉姆·多伊 0123450简·多伊 0123451吉尔·多伊 0123457姓名 Phone_Number1 Phone_Number2 Phone_Number3约翰·多伊 0
..
这确实是这个问题的重复r-split-string-using-tidyrseparate,但我无法使用 MWE目的,因为我不知道如何调整正则表达式.我基本上想要同样的东西,但在最后一个下划线之后拆分变量. 原因:我的数据中某些列针对相同的因子/类型多次显示.我想我可以将数据融合在类型字符串之前将值变量分开,然后将其再次展开为具有较少列的宽格式.我的问题是我的变量名有几个不同的下划线,我想学
..
使用以下数据: 库(tidyverse)sample_df
..
tidyr::complete() 将行添加到 data.frame 用于数据中缺失的列值的组合.示例: 库(dplyr)图书馆(tidyr)df %tidyr::完成(人,观察ID,填充 = 列表(值 = 0)) 产量 # A tibble: 4 × 3人员观察_id 值1 1 1 12 1 2 03 2 1 14 2 2 1 dfperson == 1 和
..
有一个这样的数据框 other=data.frame(name=c("a","b","a","c","d"),result=c("Y","N","Y","Y","N")) 如何在 tidyr 或其他函数中使用扩展函数来获取结果 Y 或 N 的计数作为这样的列标题 name Y N2 00 1 谢谢 解决方案 以下是解决方案的几种方法: 1) 使用库 dplyr,您可以简单地将
..
在这里之前已经有关于这个话题的问题,但是我仍在努力传播这一点.我希望每个 state 都有自己的温度值列. 这是我的数据的 dput().我称之为df structure(list(date = c("2018-01-21", "2018-01-21", "2018-01-20","2018-01-20", "2018-01-19", "2018-01-19", "2018-01-18",
..
我正在学习 dplyr,来自 plyr,我想从 xtabs 的输出生成(每组)列(每次交互). 简短总结:我得到了 A B1 NA不适用 2 我想要的时候 A B1 2 xtabs 数据如下所示: >xtabs(data=data.frame(P=c(F,T,F,T,F),A=c(F,F,T,T,T)))一个P 错误 正确错误 1 2真 1 1 现在 do( 想要数据帧中的数
..
我是使用 tidyverse 的新手.我想看看我使用这个包中的函数是否尽可能高效/简洁.我怀疑我不是. 我的原始数据将键 sym 作为每个列名的一部分. 日 a_x b_x a_y b_y1 1 -0.56047565 1.2240818 -1.0678237 0.426464222 2 -0.23017749 0.3598138 -0.2179749 -0.29507148... 我
..
我有一个相关矩阵,我将其放入数据框中,如下所示: row |变量 1 |var2 |科尔1 |一个 |乙 |0.62 |乙 |一个 |0.63 |一个 |C |0.44 |C |一个 |0.4 这些结果每行复制到 2 行,同时包含“var1"和“var2".我只需要一个,最好先使用较低的变量(例如第 1 行和第 3 行). 我一直在玩 dplyr 两个小时并阅读旧线程,但没有找到我需要的
..
如何更改下表中的内容: 类型名称 答案 nTypeA 苹果 是 5TypeA 苹果 10 号A型苹果DK 8TypeA 苹果 NA 20TypeA 橙色 是 6A型橙11号A型橙色DK 8TypeA 橙色 NA 23 更改为: 类型名称 是 否 DK NATypeA 苹果 5 10 8 20A型 橙色 6 11 8 23 我使用以下代码来获取第一个表. df_1 %相符() 然后我尝试
..
我有关于客户和他们购买的不同产品的数据: 客户产品1 安1 乙1 C二维2 E2楼3A3 乙3D4A4 乙 我想检查哪些产品组同时出现在不同客户之间.我想获得不同长度的产品组合的数量.例如,产品组合 A 和 B 一起出现在三个不同的客户身上;产品组 A、B 和 C 出现在一个客户身上.对数据中所有 2 个或更多产品的所有不同集合,依此类推.类似的东西: 产品组号甲、乙、丙 1D、E、F 1甲
..
我的数据如下所示: data("泰坦尼克号")df 如何对计数/频率进行解聚合或反向汇总并将数据集扩展回其原始的非计数观察状态? 例如,我希望 3rd, Male, Child, No 重复 35 次,1st, Women, Adult, Yes 重复 140 次,以此类推,以此类推.数据框. 提前致谢. 解决方案 没有包,我们可以根据给定的频率重复每一行: df2
..
我正在尝试使用 dplyr 和 tidyr 对一些格式不佳的数据执行上次观察结转操作.它不像我预期的那样工作. 库(dplyr)图书馆(整理)df % group_by(id) %>% fill
..