首页
Office
确定R中两个数据集之间的不同行

确定R中两个数据集之间的不同行 [英] Determining different rows between two data sets in R

查看：1034 发布时间：2017/2/24 22:22:00 r csv comparison rows import-from-csv

本文介绍了确定R中两个数据集之间的不同行的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我有两个数据文件以制表符分隔的CSV格式。文件格式如下：

I have two data files in tab separated CSV format. The files are in the following format:

EP Code    EP Name    Address    Region    ...
101654    Alpha     York Street    Northwest    ...
103628    Beta    5th Avenue    South    ...

EP代码是独一无二的。我想做的是比较两个文件相对于EP代码，确定不同的行并将它们写入一个新文件。

EP codes are unique. What I want to do is to compare two files with respect to EP codes, determine the different rows and write them into a new file.

例如，file1.csv有800行，file2.csv有850行。 file2可以是一个完全包括file1加50行的文件;或者可以 file1 - 10行+ 60行。我想确定两个数据集之间的差异。我对这两行不感兴趣。

For example, file1.csv has 800 rows and file2.csv has 850 rows. file2 could be a file completely including file1 plus 50 rows; or it could be file1 - 10 rows + 60 rows. I want to determine the differences between two data sets. I'm not interested in the mutual rows.

我如何在R中做？

推荐答案

有很多方法可以做到这一点，包括 setdiff ， intersect c $ c>％in％函数， is.element 。只需找到相交集，并使用！：


There are many ways to do this, including setdiff, intersect, the %in% function, is.element.  Just find the intersecting set and exclude it using !:
diff1 <- file1[setdiff(file1$ep.code, file2$ep.code),]

 
diff2 <- file2[!(intersect(file2$ep.code, file1$ep.code)),]


                        这篇关于确定R中两个数据集之间的不同行的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            查找两个数据集之间的交集;
                        
                    
                    
                        
                            计算两个数据集之间的匹配率;
                        
                    
                    
                        
                            两个数据集之间的SAS迭代循环;
                        
                    
                    
                        
                            匹配R中多个“脏"列中的两个数据集;
                        
                    
                    
                        
                            计算两个数据帧之间的熊猫集差异;
                        
                    
                    
                        
                            查找两个数据集之间差异的有效方法;
                        
                    
                    
                        
                            读取有关 r 中不同行数的数据集时出错?;
                        
                    
                    
                        
                            在R中将两个具有不同行数的数据帧合并;
                        
                    
                    
                        
                            r比较两个数据框之间的列类型;
                        
                    
                    
                        
                            比较pyspark中的两个数据集;
                        
                    
                    
                        
                            比较pyspark中的两个数据集;
                        
                    
                    
                        
                            合并熊猫中的两个数据集;
                        
                    
                    
                        
                            R中两个数据帧的行之间的欧几里德距离;
                        
                    
                    
                        
                            R中两个数据帧的行之间的欧式距离;
                        
                    
                    
                        
                            塔塔：比较两个数据集拖放不同的变量;
                        
                    
                    
                        
                            两个数据集或数组之间的相似性;
                        
                    
                    
                        
                            在R中的两个数据帧之间添加命名行;
                        
                    
                    
                        
                            部分合并两个数据集并填写R中的NAs;
                        
                    
                    
                        
                            当两个数据框具有不同的列集时，按行组合两个数据框 (rbind);
                        
                    
                    
                        
                            在 Pandas 中合并两个数据集;
                        
                    
                    
                        
                            两个不同对象的两个数组的并集;
                        
                    
                    
                        
                            R基于添加条件的特定列合并两个数据集;
                        
                    
                    
                        
                            计算两个数据集的两点之间的距离(最近邻);
                        
                    
                    
                        
                            Mathematica 中带有两个数据集的 ListPlot;
                        
                    
                    
                        
                            Mapreduce/Hadoop中两个数据集的合并;


    
        
            Office最新文章
            
                    
                        
                            数组作为Excel中的条件COUNTIFS函数，混合AND和OR;
                        
                    
                    
                        
                            文件（文件，“rt”）中的错误：无法打开连接;
                        
                    
                    
                        
                            在matlab中从CSV文件中读取特定列;
                        
                    
                    
                        
                            Excel错误：已删除记录：从/xl/worksheets/sheet10.xml部分排序;
                        
                    
                    
                        
                            excel：无法保存或导出xml数据。此工作簿中的xml映射不可导出;
                        
                    
                    
                        
                            xlsx错误：“已删除的记录：来自/xl/workbook.xml部分的命名范围”当尝试解决错误;
                        
                    
                    
                        
                            Microsoft Excel无法插入新单元格;
                        
                    
                    
                        
                            R：如何解决is.data.frame（x）中的错误：object''找不到？;
                        
                    
                    
                        
                            如何使用命令提示符将JMeter聚合报告结果保存到CSV文件？;
                        
                    
                    
                        
                            如何使用vba将工作表复制到另一个工作簿？;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.