У меня есть следующая таблица с двумя столбцами: ID и Title, содержащая более 500 000 записей. Например:
ID Title
-- ------------------------
1 Aliens
2 Aliens (1986)
3 Aliens vs Predator
4 Aliens 2
5 The making of "Aliens"
Мне нужно найти записи, которые очень похожи, и я имею в виду, что они отличаются от 3-6 букв, обычно это различие находится в конце Заголовков. Поэтому я должен спроектировать запрос, который возвращает записи нет. 1,2 и 4. Я уже смотрел на расстояние левенштайн, но я не знаю, как его применять. Также из-за количества записей запрос не должен длиться всю ночь.
Спасибо за любую идею или предложение