首页
其他开发
使用awk如何打印包含特定列的重复项的所有行？

使用awk如何打印包含特定列的重复项的所有行？ [英] Using awk how do I print all lines containing duplicates of specific columns?

查看：492 发布时间：2017/7/21 19:05:34 awk printing duplicates find multiple-columns

本文介绍了使用awk如何打印包含特定列的重复项的所有行？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

输入：

a;3;c;1
a;4;b;2
a;5;c;1

输出：

a;3;c;1
a;5;c;1

因此，应打印所有列1,3和4的重复行。

Hence, all lines which have duplicates of columns 1,3 and 4 should be printed.

推荐答案

如果一个2遍的方法是可行的：

If a 2-pass approach is OK:

$ awk -F';' '{key=$1 FS $3 FS $4} NR==FNR{cnt[key]++;next} cnt[key]>1' file file
a;3;c;1
a;5;c;1

否则：

$ awk -F';' '
    { key=$1 FS $3 FS $4; a[key,++cnt[key]]=$0 }
    END {
        for (key in cnt)
            if (cnt[key] > 1)
                for (i=1; i<=cnt[key]; i++)
                    print a[key,i]
    }
' file
a;3;c;1
a;5;c;1

该第二个脚本中的键的输出顺序将是随机的，中的运算符 - 如果这是一个问题，很容易修复。


The output order of keys in that second script will be random due to the in operator - easily fixed if that's an issue.

                        这篇关于使用awk如何打印包含特定列的重复项的所有行？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！


                    
                        查看全文


        
            



        
        
            相关文章
            
                    
                        
                            特定行的AWK打印命令;
                        
                    
                    
                        
                            awk根据特定的列值完全删除重复的行;
                        
                    
                    
                        
                            使用awk打印列中的部分匹配项;
                        
                    
                    
                        
                            awk +如何在列中查找重复项?;
                        
                    
                    
                        
                            如何打印用awk一个特定的号码之后的所有列？;
                        
                    
                    
                        
                            如何使用awk将重复的行集转置为列;
                        
                    
                    
                        
                            如何使用awk重命名重复的行?;
                        
                    
                    
                        
                            使用awk以相同的格式为所有列打印$ 0;
                        
                    
                    
                        
                            使用awk打印从第n到最后的所有列;
                        
                    
                    
                        
                            使用awk每列的打印总和;
                        
                    
                    
                        
                            如何使用awk对重复行的值求和?;
                        
                    
                    
                        
                            如何使用 awk 打印字段与特定字符串匹配的行?;
                        
                    
                    
                        
                            awk-打印包含在初始分析中找到的最大值的所有行;
                        
                    
                    
                        
                            如何使用awk打印最后两列;
                        
                    
                    
                        
                            使用awk提取包含空格的列;
                        
                    
                    
                        
                            省略包含特定NA列的行;
                        
                    
                    
                        
                            用awk打印一行特定索引字符;
                        
                    
                    
                        
                            省略包含特定列的 NA 的行;
                        
                    
                    
                        
                            行不包含所有列的数据;
                        
                    
                    
                        
                            与AWK打印列;
                        
                    
                    
                        
                            使用awk，删除在不同索引中具有重复的成对列的行;
                        
                    
                    
                        
                            awk-打印包含在初始分析中找到的最大值的所有行(行之间包含U + 2500 Unicode字符);
                        
                    
                    
                        
                            熊猫更改重复行的特定列值;
                        
                    
                    
                        
                            打印只是awk的某些列;
                        
                    
                    
                        
                            根据 RDD/Spark DataFrame 中的特定列从行中删除重复项;


    
        
            其他开发最新文章
            
                    
                        
                            拒绝显示一个框架，因为它将'X-Frame-Options'设置为'sameorigin';
                        
                    
                    
                        
                            什么是＆QUOT; AW＆QUOT;在部分标志属性是什么意思？;
                        
                    
                    
                        
                            在运行npm install命令时获取'npm WARN弃用'警告;
                        
                    
                    
                        
                            cmake无法找到openssl;
                        
                    
                    
                        
                            从Spark的scala中的* .tar.gz压缩文件中读取HDF5文件;
                        
                    
                    
                        
                            Twitter :: Error :: Forbidden  - 无法验证您的凭据;
                        
                    
                    
                        
                            我什么时候需要一个fb：app_id或者fb：admins？;
                        
                    
                    
                        
                            将.db文件导入R;
                        
                    
                    
                        
                            npm通知创建一个lockfile作为package-lock.json。你应该提交这个文件;
                        
                    
                    
                        
                            拒绝执行内联脚本，因为它违反了以下内容安全策略指令：“script-src'self'”;
                        
                    
            
        
        
            
                热门教程
            
            
                
                    
                        Java教程
                    
                
                
                    
                        Apache ANT 教程
                    
                
                
                    
                        Kali Linux教程
                    
                
                
                    
                        JavaScript教程
                    
                
                
                    
                        JavaFx教程
                    
                
                
                    
                        MFC 教程
                    
                
                
                    
                        Apache HTTP客户端教程
                    
                
                
                    
                        Microsoft Visio 教程
                    
                
            
        
        
            
                热门工具
            
            
                
                
                    
                        Java 在线工具
                    
                
                
                    
                        C(GCC) 在线工具
                    
                
                
                    
                        PHP 在线工具
                    
                
                
                    
                        C# 在线工具
                    
                
                
                    
                        Python 在线工具
                    
                
                
                    
                        MySQL 在线工具
                    
                
                
                    
                        VB.NET 在线工具
                    
                
                
                    
                        Lua 在线工具
                    
                
                
                    
                        Oracle 在线工具
                    
                
                
                    
                        C++(GCC) 在线工具
                    
                
                
                    
                        Go 在线工具
                    
                
                
                    
                        Fortran 在线工具



    
        
            登录
            关闭
        
        
            
                扫码关注1秒登录
            
            
                
            
            
                
                
            
            
                发送“验证码”获取
                |
                15天全站免登陆
            
            
        
    
    





    
		
			友情链接：
            IT屋
            Chrome插件
            谷歌浏览器插件
        
        
            IT屋
            ©2016-2022 琼ICP备2021000895号-1
            站点地图
            站点标签
            SiteMap
            <免责申明>
            本站内容来源互联网,如果侵犯您的权益请联系我们删除.