重塑/聚集功能以创建可用于多层次分析的数据集 [英] Reshape/gather function to create dataset ready for multilevel analysis

查看：11 发布时间：2022/4/18 12:01:32 r reshape melt multi-level multilevel-analysis

本文介绍了重塑/聚集功能以创建可用于多层次分析的数据集的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我有一个很大的数据集，有240个病例，代表240名患者。他们都接受了神经心理测试，并填写了调查问卷。此外，他们的重要其他人(下称：代理人)也填写了调查问卷。由于‘病人’和‘代理’嵌套在‘夫妻’中，因此我想在R中进行多层次分析。为此，我需要重塑我的数据集以运行此类分析。

简单地说，我想‘复制’我的行。对于双主体ID，添加一个带有1和2的新变量，其中1代表患者数据，2代表代理数据。然后，我希望用1.所有患者数据和包含代理数据的列填充1.所有代理数据为NA或空或其他值，以及2.所有代理数据和所有患者数据为NA或空。

假设这是我的数据：

id <- c(1:5)
names <- c('id', 'p1', 'p2', 'p3', 'pr1', 'pr2', 'pr3')
p1 <- c(sample(1:10, 5))
p2 <- c(sample(10:20, 5))
p3 <- c(sample(20:30, 5))
pr1 <- c(sample(1:10, 5))
pr2 <- c(sample(10:20, 5))
pr3 <- c(sample(20:30, 5))

mydf <- as.data.frame(matrix(c(id, p1, p2, p3, pr1, pr2, pr3), nrow = 5))
colnames(mydf) <- names

>mydf

   id p1 p2 p3 pr1 pr2 pr3
1  1  6  20 22 1   10  24
2  2  8  11 24 2   18  29
3  3  7  10 25 6   20  26
4  4  3  14 20 10  15  20
5  5  5  19 29 7   14  22

我希望我的数据最终是这样的：

id2 <- rep(c(1:5), each = 2)
names2 <- c('id', 'couple', 'q1', 'q2', 'q3')
couple <- rep(1:2, 5)
p1 <- c(sample(1:10, 5))
p2 <- c(sample(10:20, 5))
p3 <- c(sample(20:30, 5))
pr1 <- c(sample(1:10, 5))
pr2 <- c(sample(10:20, 5))
pr3 <- c(sample(20:30, 5))

mydf <- as.data.frame(matrix(c(id2, couple, p1, p2, p3, pr1, pr2, pr3), nrow = 10, ncol = 5))
colnames(mydf) <- names2

>mydf
   id couple q1 q2 q3
1   1      1  6 23 16
2   1      2 10 28 10
3   2      1  1 27 14
4   2      2  7 21 20
5   3      1  5 30 18
6   3      2 12  2 27
7   4      1 10  1 25
8   4      2 13  7 21
9   5      1 11  6 20
10  5      2 18  3 23

或者，如果这不可能，则如下所示：

   id couple bb1 bb2 bb3 pbb1 pbb2 pbb3
1   1      1  6  23  16
2   1      2             10   28   10
3   2      1  1  27  14
4   2      2             7    21   20
5   3      1  5  30  18
6   3      2             12   2    27
7   4      1 10   1  25
8   4      2             13   7    21
9   5      1 11   6  20
10  5      2             18   3    23

现在，为了让我做到这一点，我尝试了Melt()函数和Gather()函数，感觉就快成功了，但它仍然没有以我希望的方式工作。

注意，在我的数据集中，患者调查问卷的变量名称为bb1：bb54，代理调查问卷的变量名称为pbb1：pbb54

我尝试过的示例

df_long <- df_reshape %>%
gather(testname, value, -(bb1:bb11), -(pbb1:pbb11), -id, -pgebdat, -p_age, na.rm=T) %>%
arrange(id)

推荐答案

一种方法是在tidyr中使用unite和separate，同时使用gather函数。

我使用的是您提供的mydf数据框，但进行任何更改应该非常简单：

mydf %>% 
  unite(p1:p3, col = `1`, sep = ";") %>% # Combine responses of 'p1' through 'p3'
  unite(pr1:pr3, col = `2`, sep = ";") %>% # Combine responses of 'pr1' through 'pr3'
  gather(couple, value, `1`:`2`) %>% # Form into long data
  separate(value, sep = ";", into = c("q1", "q2", "q3"), convert = TRUE) %>% # Separate and retrieve original answers
  arrange(id)

这为您提供了：

   id couple q1 q2 q3
1   1      1  9 18 25
2   1      2 10 18 30
3   2      1  1 11 29
4   2      2  2 15 29
5   3      1 10 19 26
6   3      2  3 19 25
7   4      1  7 10 23
8   4      2  1 20 28
9   5      1  6 16 21
10  5      2  5 12 26

我们的数字不同，因为它们都是用sample随机生成的。

根据@Alistaire注释进行编辑：将convert = TRUE添加到separate调用以确保响应仍为整型。

这篇关于重塑/聚集功能以创建可用于多层次分析的数据集的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

重塑/聚集功能以创建可用于多层次分析的数据集 [英] Reshape/gather function to create dataset ready for multilevel analysis

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录关闭

重塑/聚集功能以创建可用于多层次分析的数据集 [英] Reshape/gather function to create dataset ready for multilevel analysis

问题描述

推荐答案

相关文章

其他开发最新文章

热门教程

热门工具

登录 关闭

登录关闭