记事本++检查重复行复合体 [英] notepad++ check for duplicate lines complex

查看:14
本文介绍了记事本++检查重复行复合体的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

示例

40000多行GUID如下:

GUID: 0981723409871243

在所有GUID中搜索重复项

示例:

GUID: 124432408213
GUID: 08917234071423
GUID: 0189742381
GUID: 08917234071423
GUID: 0817423423
GUID: 124432408213

我有TextFX和Compare,但如何找到此部件有2个124432408213和2个08917234071423

在可能存在重复项的40,000行中,我无法轻松检测到它们,我需要一种方法来查找重复项。

应该类似于GUID:"在GUID之后搜索文本"下一行,然后继续搜索每个GUID.我可以编写一个自定义程序来执行此操作,但是.尝试避免执行此操作TextFX功能相当强大,只是看不到这样做的方法.

我应该在这里添加更多信息示例:

[块1] GUID:? 更多信息:? [/块1]

每个挡路都是这样格式化的..

推荐答案

使用TextFx对输入行进行排序并保留副本。接下来执行正则表达式搜索,在标记选项卡中设置书签行。搜索文本应为^(GUID:s*d+ )1,然后单击标记全部**。然后使用MENU=>搜索=>书签=>删除未标记的行删除除重复项之外的所有内容,或使用MENU=>Search=>Bookmark=>复制已加书签的行并将行粘贴到需要的位置。如果有四个或更多相同的行,则上述操作可能以每对一个条目结束,另一个删除重复项的TextFX排序应该会删除多余的项。

对于[block1] guid: ???? more info: ??? [/block1]情况,正则表达式比较复杂,但^([block1] guid:s*d+ more info:s*d+ [/block1] )1在以下位置查找并标记重复项:

[block1] guid: 1234 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1235 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]
[block1] guid: 1236 more info: 5678 [/block1]

在Linux或类似系统上,像sort -c inputFileName | grep -v "^s*1s"sort inputFileName | unic -c | grep -v "^s*1s"sort inputFileName | uniq -d这样的命令应该可以工作,具体取决于可用的命令和选项。

这篇关于记事本++检查重复行复合体的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆