如何在data.table中操作data.frame [英] How to manipulate data.frame in the data.table
本文介绍了如何在data.table中操作data.frame的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有 data.table
,其中某些观察值列包含 data.frame
。例如:
I have the data.table
where some columns of observations contain data.frame
. For example:
data.table(colA= c('A1','A2','A3'),
colB=list(data.frame(),
data.frame(colsubB1=c('B2a','B2b'),colsubB2=c('B2c', 'B2d')),
data.frame(colsubB1=c('A3a','A3b'),colsubB2=c('A3c', 'A3d'))),
colC= c('C1','C2','C3'),
colD= c('D1','D2','D3')
)
返回
colA colB colC colD
1: A1 <data.frame> C1 D1
2: A2 <data.frame> C2 D2
3: A3 <data.frame> C3 D3
我希望得到以下结果:
colA colsubB1 colsubB2 colC colD
1: A1 <NA> <NA> C1 D1
2: A2 B2a B2c C2 D2
3: A2 B2b B2d C2 D2
4: A3 A3a A3c C3 D3
5: A3 A3b A3d C3 D3
能否请您提出一些建议?
Could you please give some suggestion?
推荐答案
使用 by
:
DT[, if(nrow(colB[[1L]]) > 0)
colB[[1L]]
else
data.frame(colsubB1=NA_character_, colsubB2=NA_character_),
by=setdiff(names(DT), "colB")]
输出:
colA colC colD colsubB1 colsubB2
1: A1 C1 D1 <NA> <NA>
2: A2 C2 D2 B2a B2c
3: A2 C2 D2 B2b B2d
4: A3 C3 D3 A3a A3c
5: A3 C3 D3 A3b A3d
数据:
library(data.table)
DT <- data.table(colA= c('A1','A2','A3'),
colB=list(data.frame(),
data.frame(colsubB1=c('B2a','B2b'),colsubB2=c('B2c', 'B2d')),
data.frame(colsubB1=c('A3a','A3b'),colsubB2=c('A3c', 'A3d'))),
colC= c('C1','C2','C3'),
colD= c('D1','D2','D3')
这篇关于如何在data.table中操作data.frame的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文