melt相关内容
我有一个包含140个变量的数据框(从RDS文件读取)。我已经给其中的3个添加了字幕。但子集只有一行,其中有三个列变量。我必须把它表示成表格,还得做一个条形图。子集数据框如下所示。 HomeCondn_Good HomeCondn_Livabl HomeCondn_Dilapdtd (dbl) (dbl) (dbl) 1
..
> df
..
我正在尝试使用熔化公式将数据框从宽格式转换为长格式。挑战在于我有多个标签相同的列名。当我使用MILL函数时,它会从重复列中删除值。我读过类似的问题,有人建议我使用重塑功能,但我无法让它工作。 要复制我的起始数据框: conversion.id
..
我正在尝试融化一个数据框,但我收到了这个奇怪的错误。知道为什么吗? str(zx7) 'data.frame': 519 obs. of 5 variables: $ calday.new: Date, format: "2011-01-03" "2011-01-04" "2011-01-05" "2011-01-06" ... $ A20 : Time-Series fr
..
我有一个很大的数据集,有240个病例,代表240名患者。他们都接受了神经心理测试,并填写了调查问卷。此外,他们的重要其他人(下称:代理人)也填写了调查问卷。由于‘病人’和‘代理’嵌套在‘夫妻’中,因此我想在R中进行多层次分析。为此,我需要重塑我的数据集以运行此类分析。 简单地说,我想‘复制’我的行。对于双主体ID,添加一个带有1和2的新变量,其中1代表患者数据,2代表代理数据。然后,我希望用
..
我要重塑具有在3个时间点测量的多个测试的宽格式数据集: ID Test Year Fall Spring Winter 1 1 2008 15 16 19 1 1 2009 12 13 27 1 2 2008 22 22 24 1 2 2
..
我刚开始使用R进行数据分析,最近我得到了一个预格式化的环境观测模型数据集,其中的一个子集示例如下所示: date site obs mod site obs mod 2000-09-01 00:00:00 campus NA 61.63 city centre 66
..
..
继续我之前的 post,我现在还有 1 列 ID 值,我需要使用这些值将行转换为列. NUM
..
我不知道如何在 python 中使用 Pandas 进行“反向融化".这是我的起始数据 将 pandas 导入为 pd从 StringIO 导入 StringIOorigin = pd.read_table(StringIO('''标签类型值x 一个 1x b 2x c 3是的 4是的 5y c 6z 一 7z b 8z c 9'''))起源输出[5]:标签类型值0 x 11 x b 22×c
..
这确实是这个问题的重复r-split-string-using-tidyrseparate,但我无法使用 MWE目的,因为我不知道如何调整正则表达式.我基本上想要同样的东西,但在最后一个下划线之后拆分变量. 原因:我的数据中某些列针对相同的因子/类型多次显示.我想我可以将数据融合在类型字符串之前将值变量分开,然后将其再次展开为具有较少列的宽格式.我的问题是我的变量名有几个不同的下划线,我想学
..
我有两个数据框: 合作伙伴 这是一个购物篮分析.df1 是购买了列出的每个项目的客户/合作伙伴:A、B、C...等. df2 是与过去购买的物品相关的推荐. 每个 df2 行中的最后一个值代表建议.因此,从最后一个非 NA 值开始的每一行中的前面值是“篮子". 所以比如df2的第一行,就是说:如果B和A一起买,推荐G. 我希望能够弄清楚 df1 的每个合作伙伴是否购买了
..
我正在使用 data.table::melt() 中的 patterns() 参数来融合具有多个易于定义模式的列的数据.它正在工作,但我没有看到如何创建字符索引变量而不是默认的数字细分. 例如,在数据集 'A' 中,dog 和 cat 列名具有数字后缀(例如 'dog_1'、'cat_2'),在 melt 中可以正确处理(见结果“变量"列): A = data.table(idcol =
..
我有两个数据框: 合作伙伴 这是一个购物篮分析.df1 是购买了列出的每个项目的客户/合作伙伴:A、B、C...等. df2 是与过去购买的物品相关的推荐. 每个 df2 行中的最后一个值代表推荐.因此,从最后一个非 NA 值开始的每一行中前面的值是“篮子". 所以比如df2的第一行写着:如果B和A一起买,推荐G. 我希望能够弄清楚 df1 的每个合作伙伴是否购买了每行
..
在 pandas 标签上,我经常看到用户询问有关在 Pandas 中融合数据框的问题.我将尝试针对此主题进行规范的问答(自我回答). 我要澄清: 什么是融化? 我如何使用melt? 我什么时候使用melt? 我看到了一些关于融化的热门问题,例如: pandas 将一些列转换为行:实际上是这个可能不错,但多一些解释会更好. Pandas Melt Funct
..
我需要将宽表改造成长格式,但为每条记录保留多个字段,例如: dw 我有使用 melt 和 reshape 的基本知识,但我不清楚如何在我的情况下应用这种重塑. 解决方案 reshape 使用适当的参数来做到这一点. variing 列出了以宽格式存在但在长格式中被拆分为多行的列.v.names 是等价的长格式.在两者之间,创建了一个映射. 来自?reshape: 此
..
在 PySpark 或至少在 Scala 中的 Apache Spark 中是否有 Pandas Melt 函数的等价物? 我一直在 python 中运行一个示例数据集,现在我想对整个数据集使用 Spark. 提前致谢. 解决方案 没有内置函数(如果您使用 SQL 和 Hive 支持,您可以使用 stack 函数,但在 Spark 中没有暴露,也没有原生实施),但推出自己的产品
..
在 PySpark 或至少在 Scala 中的 Apache Spark 中是否有等效的 Pandas Melt 函数? 我一直在 python 中运行一个示例数据集,现在我想对整个数据集使用 Spark. 提前致谢. 解决方案 没有内置函数(如果您使用 SQL 和 Hive 支持,您可以使用 stack 函数,但在 Spark 中没有暴露,也没有原生实施),但推出自己的产品是
..
我有一个非常大的数据集,需要针对 4 种不同处理的多个物种进行单独的单向方差分析,并进行多次测量.通常我只是为每个物种制作单独的 excel 电子表格,并在每个物种上运行方差分析,循环遍历每个测量列,但这非常耗时.是否可以使用单个电子表格并对融化的数据运行方差分析?或者也许我可以使用另一个重塑选项? 数据: structure(list(Species = c("A", "A", "A",
..
是否有一个 Snowflake 命令可以像这样转换表格: a,b,c1,10,0.12,11,0.123、12、0.13 到这样的表: 键,值一,1a2一、3乙,10乙,11乙,13c,0.1c,0.12c,0.13 ? 这个操作在其他表格系统中常被称为melt,但其基本思想是将表格转化为键值对列表. SnowSQL 中有一个 UNPIVOT,但据我所知 UNPIVOT 需要手
..