dcast相关内容
我正在尝试为包含多个组的数据框的多列找到不包括 NA 的方法 airquality 所以我得到了一个带有数字的名称列表,所以我知道要选择哪些列: nam 我想按城市和年份计算 PM25、臭氧和二氧化碳的平均值.这意味着我需要列 1,2,4,6:7) acast(datadf, year ~ city, mean, na.rm=TRUE) 但这并不是我真正想要的,因为它包含了我不需要的
..
我的数据如下所示: 我试图让它看起来像这样: 我想在 tidyverse 中使用 %>%-chaining 来做到这一点. df 我尝试过的: data.table::dcast( df, formula = id ~ start_end, value.var = "date", drop = FALSE) # 不起作用,因为它汇总了数据tidyr::spread( df, s
..
我想转换一个包含联系信息的数据框,其中包含类似信息的城市列表,例如电话号码出现在多列中. 我尝试使用 reshape2::dcast() 和 tidyr::spread(),这两种方法都不能解决我的问题.我还检查了堆栈溢出的其他帖子,例如 多列展开 尚未找到有效的解决方案.在我看来,这些问题应该相当简单(并且可以通过 spread 或 dcast 解决). tmp % # 同上
..
我正在尝试将长格式的风数据转换为宽格式。风速和风向都在Parameter.Name列中列出。这些值需要同时由Local.Site.Name和Date.Local变量强制转换。 如果每个唯一的Local.Site.Name + Date.Local行有多个观测值,那么我想要这些观测值的平均值。内置参数“ fun.aggregate = mean”对于风速来说效果很好,但是由于值是以度为单位,因
..
我的数据框如下: + ------ + ---- +- -------- + ---------- + |来自|到|优先|距离| + ------ + ---- + ---------- + ---------- + | 1 | 3 | 1 | 10 | | 1 | 5 | 1 | 10 | | 2 | 7 | 1 | 10 | | 3 | 9 | 1 | 15 |
..
我有一个数据表,形式为 ID区域INCOME_BAND RESIDENCY_YEARS 1个软件在5,000以下10-15 2威尔士超过70,000 1-5 3中心15,000-19,999 6-9 4 SE 15,000-19,999 15-19 5北15,000-19,999 10-15 6北15,000-19,999 6-9 创建者
..
成千上万的答案描述了如何从宽变长到重塑以及如何通过某些变量进行组织。我不知道我没有把头缠住。 我需要组织最初以rater,obs,val1,val2等开头的行。放入 IRR 。 给出与我的数据类似的格式,可以使用以下格式创建: r1
..
我有以下数据集 client_id
..
我在 library(reshape2)包中使用 dcast 函数来转换一个简单的三张表列 df = data.table(id = 1:1e6, var = c('continent','次大陆',...), val = c('America','Caribbean',...)```` 通过 dcast(df,id〜var,value.var ='val')并自动将值
..
我想像这样转换一个表(*): set.seed(1) mydata
..
如何像这样 X = data.frame( ID = c (1,1,1,2,2), 名称= c(“ MIKE”,“ MIKE”,“ MIKE”,“ LUCY”,“ LUCY”), SEX = c(“ MALE”,“ MALE”,“ MALE”,“ FEMALE”,“ FEMALE”), 测试= c(1,2,3,1,2), 分数= c(70,80 ,90,65,75) ) Y =
..
我正尝试使用
..
我正在尝试使用dcast重塑数据。我正在处理每个样本有10-30个样本单位的样本。我无法汇总我的数据。 我的数据采用以下格式: ID总计 sample_1 1 sample_1 0 sample_1 2 sample_1 1 sample_1 0 sample_1 0 sample_1 2 样品_1 1 样品_1 0 样品_1 2 样品_1 1 样
..
我正在尝试找到不包含NA的方法,以用于多个列和多个组的数据框 airquality< ;-data.frame(City = c(“ CityA”,“ CityA”,“ CityA”, “ CityB”,“ CityB”,“ CityB”, “ CityC”,“ CityC”) , year = c(“ 1990”,“ 2000”,“ 2010”,“ 1990”, “ 2000”,“
..
我有一个面板数据集:panel和一个带有事件列表的数据集:Events.对于面板数据集,相等的panelID表示两个观察值属于同一个. panelID = c(1:50) year= c(2001:2010) country = c("NLD", "GRC", "GBR") n
..
我有一个面板数据集:panel和一个带有事件列表的数据集:Events.对于面板数据集,等于panelID表示两个观测值属于同一段. panelID = c(1:50) year= c(2001:2010) country = c("NLD", "GRC", "GBR") n
..
我的资料如下: 我试图让它看起来像这样: 我想使用%>%链接进行整理。 df
..
result_check% group_by(column,target)%>% summaryize(Unique_Elements = n())%>% dcast(column_code〜target,value.var =“Unique_Elements” ) 例如,如果我们采用以下数据集: column1 target AA
..
给定一个数据框架,我试图使用库(数据)中的 dcast.data.table 函数从长到宽投射。表)。但是,当在公式的左边使用大数字时,它会有一些组合方式。 下面是一个示例: df 10000000007624,10000000007767,10000000007729,10000000007705, 10000000007711,10000000007784, 10000000
..