reshape2相关内容
我有一个R数据框,它是使用 XML 包中的 readHTMLTable()从互联网上抓取的。该表看起来像以下摘录,其中包含人口和年份的多个变量/列。 (请注意,年份不是跨列重复的,而是代表总体的唯一标识符。) year1 pop1 year2 pop2 year3 pop3 1 2 16XX 4675,0 1900 6453,0 1930 9981,2 3 17XX 4739,
..
我有一个很长的数据集,我想扩大范围,我很好奇是否有一种方法可以使用R中的reshape2或tidyr包一步完成全部操作。 数据框 df 看起来像这样: id类型交易金额 20收入20100 20费用25 95 30收入50300 30费用45250 我想了解以下内容: id收入交易费用收入交易金额支出金额 20 20 25 100 95
..
这是我的data.frame: library(data.table) df
..
我已经搜索并找到了许多示例,到目前为止,我仍然无法解决将数据从宽转换为长的问题。 下面是一个示例。数据: set.seed(12345) id = 1:100 age = sample(1:100,100 ,replace = TRUE) group = sample(1:2,100,replace = TRUE) t0_var1 = sample(1:300,100,re
..
我有一个 data.table 看起来像这样: id A1g_hi A2g_hi A3g_hi A4g_hi 1 2 3 4 5 ... 我想熔化该表,使其看起来像这样: id time hi 1 1 2 1 2 3 1 3 4 1 4 5 ... 我尝试过类似的操作: 融化(dtb,measure.vars
..
我有2个这样的df ID = c('x1','x2','x5') df1
..
使用以下数据: 库(tidyverse) sample_df 数字= c(1,2,1、3、4), 水果= c(“苹果”,“李子”,“桃子”,“梨”,“桃子”)) 字母编号水果 a 1苹果 a 2李子 a 1桃子 b 3梨子 b 4桃子 我要将一组值从长格式转换为宽格式: 字母Number_1 Number_2 Fruit_1 Fruit_2 Fruit_
..
我的 df 看起来像这样: Id任务类型频率 3 1 A 2 3 1 B 3 3 2 A 3 3 2 B 0 4 1 A 3 4 1 B 3 4 2 A 1 4 2 B 3 我想按ID和得到: Id AB…Z 3 5 3 4 4 6 我尝试过: df_wide
..
我尝试使用reshape软件包对我得到的数据框进行重塑,但是使用它时,数据框中的数字已更改,但不应更改。 数据框包含多个变量以及这些变量已被测量的多次,每个人有6行,即该人被测量的6倍。现在,我想重塑数据框的形状,以便每个人只有一行而不是6行,这意味着每个变量应该存在6次(每次测量一次),这可以通过以下代码轻松完成: melteddata
..
我的数据文件的结构如下: OTU1 PIA0 1120 OTU2 PIA1 2 OTU2 PIA3 6 OTU2 PIA4 10 OTU2 PIA5 1078 OTU2 PIN1 24 OTU2 PIN2 45 OTU2 PIN3 261 OTU2 PIN4 102 OTU3 P
..
我有下表: perid date rating 10001 2005 RD 10001 2006 GN 10001 2007 GD 10002 2008 GD 10002 2009 YW 10002 2010 GN 10002 2011 GN 10003 2005 GD 10003 2006
..
我正在寻找一种从R中的数组中删除冗余维的快速方法,类似于MATLAB中的squeeze()命令. 现在,我结合了reshape2软件包中的melt()和cast()命令,但是应该有一种不太复杂的方法. 到目前为止,这是我的操作方式: require(reshape2) array3d
..
我有一个宽格式的数据框,在不同的日期范围内进行了重复测量.在我的示例中,存在三个不同的时期,所有时期都有其对应的值.例如.第一次测量(Value1)是在DateRange1Start到DateRange1End的时间段内进行的: ID DateRange1Start DateRange1End Value1 DateRange2Start DateRange2End Value2 DateR
..
我正在尝试将长格式的风数据转换为宽格式。风速和风向都在Parameter.Name列中列出。这些值需要同时由Local.Site.Name和Date.Local变量强制转换。 如果每个唯一的Local.Site.Name + Date.Local行有多个观测值,那么我想要这些观测值的平均值。内置参数“ fun.aggregate = mean”对于风速来说效果很好,但是由于值是以度为单位,因
..
如何像这样 X = data.frame( ID = c (1,1,1,2,2), 名称= c(“ MIKE”,“ MIKE”,“ MIKE”,“ LUCY”,“ LUCY”), SEX = c(“ MALE”,“ MALE”,“ MALE”,“ FEMALE”,“ FEMALE”), 测试= c(1,2,3,1,2), 分数= c(70,80 ,90,65,75) ) Y =
..
我正尝试使用
..
我正在尝试使用dcast重塑数据。我正在处理每个样本有10-30个样本单位的样本。我无法汇总我的数据。 我的数据采用以下格式: ID总计 sample_1 1 sample_1 0 sample_1 2 sample_1 1 sample_1 0 sample_1 0 sample_1 2 样品_1 1 样品_1 0 样品_1 2 样品_1 1 样
..
当我在reshape2软件包的dcast函数中使用min或max时,收到以下警告。它告诉我什么?我找不到能解释该警告消息的任何内容,我对为什么在使用max时得到警告而不是在使用均值或其他聚合函数时得到警告感到困惑。 警告消息: 在.fun(.value [0],...)中:没有min的必填参数;返回Inf 下面是一个可重现的示例: data(iris) 库(reshape
..
编辑-该问题的原标题为> 我只是在学习R,并试图找到将其应用于帮助我生命中的其他人。作为测试用例,我正在重塑一些数据,但按照我在网上找到的示例进行操作时遇到麻烦。我从以下内容开始: ID Obs 1 Obs 2 Obs 3 1 43 48 37 1 27 29 22 1 36 32 40 2 33 38 36 2 29 32 27
..
我一直试图制作一张表格,显示另一个因子的因子水平计数.为此,我查看了数十页的问题,试图使用某些软件包(dplyr,reshape)中的函数来完成工作,但未能正确使用它们. 这就是我得到的: # my data: var1
..