melt相关内容

将数据框的特定单元格转换为R中的表

我有一个包含140个变量的数据框(从RDS文件读取)。我已经给其中的3个添加了字幕。但子集只有一行,其中有三个列变量。我必须把它表示成表格,还得做一个条形图。子集数据框如下所示。 HomeCondn_Good HomeCondn_Livabl HomeCondn_Dilapdtd (dbl) (dbl) (dbl) 1 ..
发布时间:2022-04-18 14:22:32 其他开发

R-重塑-熔化错误

我正在尝试融化一个数据框,但我收到了这个奇怪的错误。知道为什么吗? str(zx7) 'data.frame': 519 obs. of 5 variables: $ calday.new: Date, format: "2011-01-03" "2011-01-04" "2011-01-05" "2011-01-06" ... $ A20 : Time-Series fr ..
发布时间:2022-04-18 12:23:12 其他开发

重塑/聚集功能以创建可用于多层次分析的数据集

我有一个很大的数据集,有240个病例,代表240名患者。他们都接受了神经心理测试,并填写了调查问卷。此外,他们的重要其他人(下称:代理人)也填写了调查问卷。由于‘病人’和‘代理’嵌套在‘夫妻’中,因此我想在R中进行多层次分析。为此,我需要重塑我的数据集以运行此类分析。 简单地说,我想‘复制’我的行。对于双主体ID,添加一个带有1和2的新变量,其中1代表患者数据,2代表代理数据。然后,我希望用 ..
发布时间:2022-04-18 12:01:32 其他开发

python pandas中融化的对面

我不知道如何在 python 中使用 Pandas 进行“反向融化".这是我的起始数据 将 pandas 导入为 pd从 StringIO 导入 StringIOorigin = pd.read_table(StringIO('''标签类型值x 一个 1x b 2x c 3是的 4是的 5y c 6z 一 7z b 8z c 9'''))起源输出[5]:标签类型值0 x 11 x b 22×c ..
发布时间:2022-01-22 20:56:05 Python

最后一个下划线后的分隔字符串

这确实是这个问题的重复r-split-string-using-tidyrseparate,但我无法使用 MWE目的,因为我不知道如何调整正则表达式.我基本上想要同样的东西,但在最后一个下划线之后拆分变量. 原因:我的数据中某些列针对相同的因子/类型多次显示.我想我可以将数据融合在类型字符串之前将值变量分开,然后将其再次展开为具有较少列的宽格式.我的问题是我的变量名有几个不同的下划线,我想学 ..
发布时间:2022-01-13 19:32:29 其他开发

匹配数据框,排除最后一个非 NA 值并忽略顺序

我有两个数据框: 合作伙伴 这是一个购物篮分析.df1 是购买了列出的每个项目的客户/合作伙伴:A、B、C...等. df2 是与过去购买的物品相关的推荐. 每个 df2 行中的最后一个值代表建议.因此,从最后一个非 NA 值开始的每一行中的前面值是“篮子". 所以比如df2的第一行,就是说:如果B和A一起买,推荐G. 我希望能够弄清楚 df1 的每个合作伙伴是否购买了 ..
发布时间:2022-01-13 19:14:45 其他开发

当变量名称包含字符串信息时使用模式融化 - 避免强制转换为数字

我正在使用 data.table::melt() 中的 patterns() 参数来融合具有多个易于定义模式的列的数据.它正在工作,但我没有看到如何创建字符索引变量而不是默认的数字细分. 例如,在数据集 'A' 中,dog 和 cat 列名具有数字后缀(例如 'dog_1'、'cat_2'),在 melt 中可以正确处理(见结果“变量"列): A = data.table(idcol = ..
发布时间:2022-01-13 18:42:37 其他开发

匹配不包括最后一个非 NA 值和无视顺序的数据帧

我有两个数据框: 合作伙伴 这是一个购物篮分析.df1 是购买了列出的每个项目的客户/合作伙伴:A、B、C...等. df2 是与过去购买的物品相关的推荐. 每个 df2 行中的最后一个值代表推荐.因此,从最后一个非 NA 值开始的每一行中前面的值是“篮子". 所以比如df2的第一行写着:如果B和A一起买,推荐G. 我希望能够弄清楚 df1 的每个合作伙伴是否购买了每行 ..
发布时间:2021-12-17 20:43:23 其他开发

如何融化熊猫数据框?

在 pandas 标签上,我经常看到用户询问有关在 Pandas 中融合数据框的问题.我将尝试针对此主题进行规范的问答(自我回答). 我要澄清: 什么是融化? 我如何使用melt? 我什么时候使用melt? 我看到了一些关于融化的热门问题,例如: pandas 将一些列转换为行:实际上是这个可能不错,但多一些解释会更好. Pandas Melt Funct ..
发布时间:2021-12-03 09:17:56 Python

使用多个值列从宽到长重塑

我需要将宽表改造成长格式,但为每条记录保留多个字段,例如: dw 我有使用 melt 和 reshape 的基本知识,但我不清楚如何在我的情况下应用这种重塑. 解决方案 reshape 使用适当的参数来做到这一点. variing 列出了以宽格式存在但在长格式中被拆分为多行的列.v.names 是等价的长格式.在两者之间,创建了一个映射. 来自?reshape: 此 ..
发布时间:2021-12-01 21:08:57 其他开发

如何融化 Spark DataFrame?

在 PySpark 或至少在 Scala 中的 Apache Spark 中是否有 Pandas Melt 函数的等价物? 我一直在 python 中运行一个示例数据集,现在我想对整个数据集使用 Spark. 提前致谢. 解决方案 没有内置函数(如果您使用 SQL 和 Hive 支持,您可以使用 stack 函数,但在 Spark 中没有暴露,也没有原生实施),但推出自己的产品 ..
发布时间:2021-11-14 21:13:29 其他开发

如何融化 Spark DataFrame?

在 PySpark 或至少在 Scala 中的 Apache Spark 中是否有等效的 Pandas Melt 函数? 我一直在 python 中运行一个示例数据集,现在我想对整个数据集使用 Spark. 提前致谢. 解决方案 没有内置函数(如果您使用 SQL 和 Hive 支持,您可以使用 stack 函数,但在 Spark 中没有暴露,也没有原生实施),但推出自己的产品是 ..
发布时间:2021-11-12 05:22:57 其他开发

融合数据框中每个子组的单向方差分析

我有一个非常大的数据集,需要针对 4 种不同处理的多个物种进行单独的单向方差分析,并进行多次测量.通常我只是为每个物种制作单独的 excel 电子表格,并在每个物种上运行方差分析,循环遍历每个测量列,但这非常耗时.是否可以使用单个电子表格并对融化的数据运行方差分析?或者也许我可以使用另一个重塑选项? 数据: structure(list(Species = c("A", "A", "A", ..
发布时间:2021-11-10 23:45:21 其他开发

雪花中是否有融化命令?

是否有一个 Snowflake 命令可以像这样转换表格: a,b,c1,10,0.12,11,0.123、12、0.13 到这样的表: 键,值一,1a2一、3乙,10乙,11乙,13c,0.1c,0.12c,0.13 ? 这个操作在其他表格系统中常被称为melt,但其基本思想是将表格转化为键值对列表. SnowSQL 中有一个 UNPIVOT,但据我所知 UNPIVOT 需要手 ..
发布时间:2021-09-14 20:10:42 其他开发