在一个文件中打印匹配另一个文件中的模式的行 [英] Print lines in one file matching patterns in another file
本文介绍了在一个文件中打印匹配另一个文件中的模式的行的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我有一个超过 40.000 行的文件 (file1),我想提取与 file2 中模式匹配的行(大约 6000 行).我是这样用grep的,但是很慢:
I have a file with more than 40.000 lines (file1) and I want to extract the lines matching patterns in file2 (about 6000 lines). I use grep like this, but it is very slow:
grep -f file2 file1 > out
是否有使用 awk
或 sed
来执行此操作的更快方法?
Is there a faster way to do this using awk
or sed
?
以下是我的文件的一些摘录:
Here's some extracts from my files:
File1
:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT
File2
:
scign000003
scign000004
scign000005
scign004671
scign000013
推荐答案
Try grep -Fwf file2 file1 >出
-F
选项指定纯字符串匹配,因此应该更快,而无需使用正则表达式引擎.
The -F
option specifies plain string matching, so should be faster without having to engage the regex engine.
这篇关于在一个文件中打印匹配另一个文件中的模式的行的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文