Я пытался найти альтернативу в течение двух дней подряд и не мог найти ничего подходящего. Я в основном пытаюсь получить вероятностную оценку синтезированного предложения (синтезированного путем замены некоторых слов из исходного предложения, выбранного из корпусов).
Я пробовал Collocations, но оценки, которые я получаю, не очень полезны. Поэтому я попытался использовать концепцию языковой модели, но обнаружил, что из-за некоторых ошибок из NLTK была удалена, казалось бы, полезная модульная "модель".
Было бы здорово, если бы кто-нибудь мог сообщить мне о каком-то альтернативном способе получения реализации модели ngram в python или, еще лучше, предложить мне другой способ решить проблему "забивания" предложения.