plyr - IT屋-程序员软件开发技术分享社区

如何使用ddply或dplyr针对数据帧计算具有非矢量化输入的多变量函数？

我正在尝试对使用Expand GRID创建的数据集中的一系列点进行数值模拟。如果可能的话，我想使用plyr或dplyr。但是，我不懂语法。下面的代码是否对f分别应用了x和y的值？ f ..

发布时间：2022-09-03 16:42:57 r plyr 其他开发

使用grepl从跨多列的文本中提取值

我有一个数据帧(Df)，其中包含州和城市的2列数据。但是，有时两列中的数据会被调换或输入错误。数据帧将如下所示： location state Bangkok Bangkok Metropolitan Central Thai Bangkok 我想创建一个新列“City”，将这两个列中的“曼谷”提取到一个单独的列中。我可以 ..

发布时间：2022-09-03 16:34:29 r if-statement plyr grepl 其他开发

根据日期按组比较值，并在值下降的位置创建新数据帧

发布时间：2022-09-03 16:28:54 r plyr lubridate dplyr 其他开发

在Spaklyr中创建虚拟变量？

我正在尝试扩展我的一些ML管道，我喜欢Spaklyr打开的RStudio、Spark和H2O的组合(http://spark.rstudio.com/) 我想弄明白的一件事是如何使用Spaklyr从数据帧中的字符向量创建伪COL。我已经尝试了下面的方法，但我认为它可能混合了一些Spaklyr尚未实现的功能。 library(sparklyr) library(dplyr) s ..

发布时间：2022-09-03 16:22:44 r apache-spark dplyr plyr sparklyr 其他开发

高效地定位数据框中的分组常量列。

如何有效地从数据框中提取按组排列的常量列？我在下面包含了一个plyr实现，以精确地说明我想要做的事情，但速度很慢。我怎样才能尽可能高效地做这件事呢？(理想情况下，根本不分割数据帧)。 base ..

发布时间：2022-09-03 16:16:29 r dataframe plyr 其他开发

使用向量函数的数据表聚合，取2

我很难使用data.table来总结向量函数的结果，这在ddply中很容易做到。问题1：使用具有向量输出的(开销很大的)函数进行聚合 dt ..

发布时间：2022-09-03 16:04:41 r data.table plyr dplyr 其他开发

R分组依据和计数

我正在处理的数据集如下 Id Date Color 10 2008-11-17 Red 10 2008-11-17 Red 10 2008-11-17 Blue 10 2010-01-26 Red 10 2010-01-2 ..

发布时间：2022-09-03 15:56:42 r group-by dplyr plyr reshape2 其他开发

了解ddply错误消息-缺少"；的参数"；，没有默认设置

我正在尝试找出为什么在使用ddply时收到错误消息。示例数据： data ..

发布时间：2022-09-03 15:49:27 r plyr 其他开发

按组划分的相关矩阵

这是我的数据框 df ..

发布时间：2022-07-18 16:41:35 r plyr correlation hmisc 其他开发

R中最快的高-宽旋转

我正在处理一个表单的简单表格 date variable value 1970-01-01 V1 0.434 1970-01-01 V2 12.12 1970-01-01 V3 921.1 1970-01-02 V1 -1.10 1970-01-03 V3 0.000 19 ..

发布时间：2022-04-18 12:29:07 r sqlite data.table plyr reshape 数据库

R中的唯一行，考虑两列，无顺序

与我发现的问题不同，我想获得两列的唯一性，没有顺序. 我有一个df: df 在这种情况下，第 1 行和第 4 行是“重复"，因为 b-a 与 b-a 相同. 我知道如何找到第 1 列和第 2 列的唯一性，但在这种方法下我会发现每一行都是唯一的. 解决方案有很多方法可以做到这一点，这里有一个: unique(t(apply(df, 1, sort)))重复(t(应用(df ..

发布时间：2022-01-30 22:52:31 r unique plyr dplyr 其他开发

为什么我的 dplyr group_by &总结不能正常工作?(名称与 plyr 冲突)

我有一个如下所示的数据框: #dfID 喂药 AUC0t Tmax Cmax1 1 0 100 5 202 1 1 200 6 253 0 1 不适用 2 304 0 0 150 6 65 以此类推.我想通过药物 DRUG 和 FED STATUS FED 总结一些关于 AUC、Tmax 和 Cmax 的统计数据.我使用 dplyr.例如:对于 AUC: CI90lo %总结(平均值=平均值 ..

发布时间：2022-01-30 22:04:03 r plyr dplyr shadowing name-collision 其他开发

如何使用 dplyr 选择每组中具有最大值的行?

我想用 dplyr 在每组中选择一个最大值的行. 首先我生成一些随机数据来显示我的问题 set.seed(1)df 在 plyr 中，我可以使用自定义函数来选择这一行. 库(plyr)ddply(df, .(A, B), function(x) x[which.max(x$value),]) 在 dplyr 中，我使用此代码来获取最大值，但不是具有最大值的行(在本例中为 C 列). ..

发布时间：2022-01-30 21:58:28 r dplyr plyr greatest-n-per-group 其他开发

更快的计算频率和从长到宽投射的方法

我正在尝试获取两个变量“week"和“id"的每个级别组合的计数.我希望结果将“id"作为行，将“week"作为列，并将计数作为值. 到目前为止我尝试过的示例(尝试了很多其他方法，包括添加一个虚拟变量 = 1，然后在上面添加 fun.aggregate = sum): 库(plyr)ddply(数据, .(id), dcast, id ~ week, value_var = "id",fu ..

发布时间：2022-01-30 21:50:51 r aggregate plyr reshape2 其他开发

在 R 中拆分应用重组、plyr、data.table

我在 R 中做经典的拆分-应用-重组事情.随着时间的推移，我的数据集是一堆公司.我正在做的应用是对每个公司进行回归并返回残差，因此，我没有按公司汇总.plyr 对此非常有用，但是当公司数量很大时，它需要很长时间才能运行.有没有办法用 data.table 做到这一点? 样本数据: dte, id, val1, val22001-10-02, 1, 10, 252001-10-03, 1, ..

发布时间：2022-01-13 19:42:54 r split plyr data.table apply 其他开发

R - 如何为唯一组序列的缺失值添加行?

我的问题与上一个问题类似在data.frame中为缺失值添加行的最快方法? 当最小/最大值因组而异时，我不知道如何添加用“NA"填充的行. >red 我希望它看起来像: 项目周期 v3 v46 1个红色6 2 b 黄色6 3 不适用不适用6 4 不适用不适用6 5 c 红色6 6 d 黄色6 7 e 红色9 2 f 黄色9 3 不适用不适用9 4克红色9 5 小时黄色当 ..

发布时间：2022-01-13 19:32:57 r data.table plyr 其他开发

如何在特定条件下创建排名变量?

我的数据包含时间变量和选择的品牌变量，如下所示.time表示购物时间，choicebrand表示当时购买的品牌. 使用这些数据，我想创建排名变量，如第三列、第四列等所示. 品牌排名(例如，brand1 - brand3)应基于过去 36 小时.因此，要计算第二行的排名，其中 shoptime 为 "2013-09-01 08:54:00 UTC"，排名应基于所有 chosenbrand ..

发布时间：2022-01-13 19:29:47 r dataframe dplyr data.table plyr 其他开发

运行长度的累积总和.这个循环可以向量化吗?

我有一个数据框，我在该数据框上计算特定列的运行长度编码.dir 列的值为 -1、0 或 1. dir.rle ..

发布时间：2022-01-13 19:29:38 r vectorization plyr data.table 其他开发

如何快速汇总和汇总数据?

我有一个标题如下所示的数据集: PID 时间站点代表计数我想通过 Rep 对每个 PID x Time x Site 组合的 Count 求和在生成的 data.frame 上，我想获取 PID x Time x Site 组合的 Count 的平均值. 目前的功能如下: dummy ..

发布时间：2022-01-13 19:22:03 r plyr data.table 其他开发

使用 data.table 聚合小计和总计

我在 R 中有一个 data.table: 库(data.table)set.seed(1)DT = 数据表(组=样本(字母[1:2]，100，替换=真)，年=样本(2010:2012,100，替换=真)，v=runif(100)) 将这些数据按组和年份汇总到汇总表中既简单又优雅: table ..

发布时间：2022-01-13 19:20:54 r aggregate plyr data.table 其他开发

plyr相关内容