У меня есть очень большие файлы данных, и по коммерческим причинам я должен выполнять обширные манипуляции с строками (заменяя символы и строки). Это неизбежно. Количество замен составляет сотни тысяч.
Это займет больше времени, чем хотелось бы. PHP, как правило, очень быстрый, но я делаю так много этих строковых манипуляций, что он замедляется, а выполнение script выполняется в минутах. Это боль, потому что script выполняется часто.
Я провел некоторое тестирование и обнаружил, что str_replace быстрее, затем strstr, а затем preg_replace. Я также пробовал отдельные инструкции str_replace, а также создавал массивы шаблонов и замен.
Я играю с идеей изолировать операцию манипуляции строкой и писать на другом языке, но я не хочу вкладывать время в этот параметр, только чтобы найти, что улучшения незначительны. Кроме того, я знаю только Perl, PHP и COBOL, поэтому для любого другого языка мне нужно будет сначала изучить его.
Мне интересно, как другие люди подошли к подобным проблемам?
Я искал, и я не считаю, что это дублирует любые существующие вопросы.