Допустим, у меня есть текстовый файл размером 1000 ГБ. Мне нужно найти, сколько раз фраза возникает в тексте.
Есть ли какой-нибудь более быстрый способ сделать это, чем тот, который я использую ниже? Сколько потребуется для выполнения задачи.
phrase = "how fast it is"
count = 0
with open('bigfile.txt') as f:
for line in f:
count += line.count(phrase)
Если я прав, если у меня нет этого файла в памяти, я бы подождал, пока компьютер загрузит файл каждый раз, когда я делаю поиск, и это займет не менее 4000 секунд для 250 МБ/сек. диск и файл размером 10000 ГБ.