我需要一个工具来查找重复或单一文本文件中的文本相似的块或一组文本文件 [英] I need a tool to find duplicates or similar blocks of text in a singular text file or set of text files

查看:130
本文介绍了我需要一个工具来查找重复或单一文本文件中的文本相似的块或一组文本文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我要自动移动的重复或类C code到功能。

I want to automate moving duplicate or similar C code into functions.

这必须在Linux下正常工作。

This must work under Linux.

推荐答案

你的问题的一个子集:检测重复code:

A subset of your problem: Detecting duplicate code:

尝试: PMD

复制code可能很难找到,特别是在一个大型项目。但是,PMD的复制/粘贴探测器(CPD)可以帮您找到它! CPD已通过三个主要的化身:

Duplicate code can be hard to find, especially in a large project. But PMD's Copy/Paste Detector (CPD) can find it for you! CPD has been through three major incarnations:


      
  • 首先,我们写的使用迈克尔·怀斯的贪婪字符串拼接算法的一个变种(变种我们这里描述)

  •   
  • 然后,它是由布莱恩Ewins使用Burrows-Wheeler变换完全重写

  •   
  • 最后,由史蒂夫·霍金斯重写使用卡普 - 拉宾字符串匹配算法。

  •   

...

注意CPD处理Java,JSP,C,C ++,Fortran和PHP code。

Note that CPD works with Java, JSP, C, C++, Fortran and PHP code.

这篇关于我需要一个工具来查找重复或单一文本文件中的文本相似的块或一组文本文件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆