首页
其他开发
对 data.table 进行高效的逐行操作

对 data.table 进行高效的逐行操作 [英] Efficient row-wise operations on a data.table

查看：18 发布时间：2022/1/13 18:51:05 r data.table

本文介绍了对 data.table 进行高效的逐行操作的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我需要找到许多 (+60) 相对较大 data.frame (~ 250,000 x 3) 的行最小值(或者我可以等效地处理 xts).


I need to find the row-wise minimum of many (+60) relatively large data.frame (~ 250,000 x 3) (or I can equivalently work on an xts).
set.seed(1000)
my.df <- sample(1:5, 250000*3, replace=TRUE)
dim(my.df) <- c(250000,3)
my.df <- as.data.frame(my.df)
names(my.df) <- c("A", "B", "C")

数据框my.df如下所示
> head(my.df)

  A B C
1 2 5 2
2 4 5 5
3 1 5 3
4 4 4 3
5 3 5 5
6 1 5 3

我试过了
require(data.table)
my.dt <- as.data.table(my.df)

my.dt[, row.min:=0]  # without this: "Attempt to add new column(s) and set subset of rows at the same time"
system.time(
  for (i in 1:dim(my.dt)[1]) my.dt[i, row.min:= min(A, B, C)]
)

在我的系统上，这大约需要 400 秒.它有效，但我不相信这是使用 data.table 的最佳方式.我是否正确使用 data.table ?有没有更高效的如何进行简单的逐行操作?
On my system this takes ~400 seconds. It works, but I am not confident it is the best way to use data.table.
Am I using data.table correctly? Is there a more efficient
way to do simple row-wise opertations?
推荐答案
或者，只是 pmin.
my.dt <- as.data.table(my.df)
system.time(my.dt[,row.min:=pmin(A,B,C)])
# user  system elapsed 
# 0.02    0.00    0.01 
head(my.dt)
#      A B C row.min
# [1,] 2 5 2       2
# [2,] 4 5 5       4
# [3,] 1 5 3       1
# [4,] 4 4 3       3
# [5,] 3 5 5       3
# [6,] 1 5 3       1


                        这篇关于对 data.table 进行高效的逐行操作的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            如何对data.table中的.SD列执行逐行操作;
                        
                    
                    
                        
                            data.table 中的逐行操作和更新;
                        
                    
                    
                        
                            如何在data.table中加快这个逐行操作;
                        
                    
                    
                        
                            如何进行 data.table 合并操作;
                        
                    
                    
                        
                            在data.table中按组对行进行滚动操作;
                        
                    
                    
                        
                            快速熔化data.table操作;
                        
                    
                    
                        
                            data.table中的行操作;
                        
                    
                    
                        
                            使用 `by = .I` 在 data.table 中进行行操作;
                        
                    
                    
                        
                            data.table：使用函数逐行转换列的子集;
                        
                    
                    
                        
                            data.table |组内更快的逐行递归更新;
                        
                    
                    
                        
                            如何按多列对 data.table 进行分组?;
                        
                    
                    
                        
                            在 data.table 中对因子水平进行分组;
                        
                    
                    
                        
                            如何按多列对data.table进行分组?;
                        
                    
                    
                        
                            使用常量对data.table更新进行联接;
                        
                    
                    
                        
                            使用data.table进行聚合;
                        
                    
                    
                        
                            高效计算 data.table 列的线性组合;
                        
                    
                    
                        
                            通过列名的字符向量对data.table进行排序;
                        
                    
                    
                        
                            通过函数对每行data.table的值进行过滤;
                        
                    
                    
                        
                            data.table或dplyr  - 数据操作;
                        
                    
                    
                        
                            data.table 子集的条件 data.table 匹配;
                        
                    
                    
                        
                            条件data.table匹配data.table的子集;
                        
                    
                    
                        
                            不能操作data.table中的列;
                        
                    
                    
                        
                            我如何在嵌套的data.table-data.table中的data.table中进行FAST / ADVANCE数据操作;
                        
                    
                    
                        
                            在data.table中的列之间逐行连接值;
                        
                    
                    
                        
                            我的方法在data.table重复行的高效？;


    
        
            其他开发最新文章
            
                    
                        
                            拒绝显示一个框架，因为它将'X-Frame-Options'设置为'sameorigin';
                        
                    
                    
                        
                            什么是＆QUOT; AW＆QUOT;在部分标志属性是什么意思？;
                        
                    
                    
                        
                            在运行npm install命令时获取'npm WARN弃用'警告;
                        
                    
                    
                        
                            cmake无法找到openssl;
                        
                    
                    
                        
                            从Spark的scala中的* .tar.gz压缩文件中读取HDF5文件;
                        
                    
                    
                        
                            Twitter :: Error :: Forbidden  - 无法验证您的凭据;
                        
                    
                    
                        
                            我什么时候需要一个fb：app_id或者fb：admins？;
                        
                    
                    
                        
                            将.db文件导入R;
                        
                    
                    
                        
                            npm通知创建一个lockfile作为package-lock.json。你应该提交这个文件;
                        
                    
                    
                        
                            拒绝执行内联脚本，因为它违反了以下内容安全策略指令：“script-src'self'”;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.