У меня есть файл с более чем 40 000 строк (file1), и я хочу извлечь строки, соответствующие шаблонам в файле2 (около 6000 строк). Я использую grep, как это, но он очень медленный:
grep -f file2 file1 > out
Есть ли более быстрый способ сделать это с помощью awk
или sed
?
Вот некоторые выдержки из моих файлов:
File1:
scitn003869.2| scign003869 CGCATGTGTGCATGTATTATCGTATCCCTTG
scitn007747.1| scign007747 CACGCAGACGCAGTGGAGCATTCCAGGTCACAA
scitn003155.1| scign003155 TAAAAATCGTTAGCACTCGCTTGGTACACTAAC
scitn018252.1| scign018252 CGTGTGTGTGCATATGTGTGCATGCGTG
scitn004671.2| scign004671 TCCTCAGGTTTTGAAAGGCAGGGTAAGTGCT
File2:
scign000003
scign000004
scign000005
scign004671
scign000013
`