Я делаю викторину, и когда викторины вставляют вопросы в Банк вопросов, я должен проверить БД на повторяющиеся/очень похожие вопросы.
Тестирование MySQL MATCH()... AGAINST(), самая высокая релевантность, которую я получаю, равна 30+, когда я тестирую 100% аналогичная строка.
Так что же такое релевантность? Чтобы процитировать руководство :
Значения релевантности - неотрицательные числа с плавающей запятой. Нулевая релевантность означает отсутствие сходства. Релевантность вычисляется на основе количества слов в строке, количества уникальных слов в этой строке, общего количества слов в коллекции и количества документов (строк), содержащих определенное слово.
Моя проблема заключается в том, как проверить значение релевантности, если строка является дубликатом. Если он 100% дублируется, не позволяйте ему входить в Банк вопросов. Но если это так похоже, попросите викторину проверить, вставить или нет. Итак, как мне это сделать? 30+ для 100% идентичной строки не является процентом, поэтому я пень.
Спасибо заранее.