Обработка естественного языка (NLP), особенно для английского языка, превратилась в стадию, когда истощение станет архаичной технологией, если существуют "идеальные" лемматизаторы. Это потому, что стволовые изменят поверхностную форму слова/токена на некоторые бессмысленные стебли.
И снова определение "идеального" лемматизатора является сомнительным, потому что другая задача НЛП потребовала бы различного уровня лемматизации. Например. Преобразование слов между глаголами/существительными/прилагательными..
Stemmers
[in]: having
[out]: hav
Lemmatizers
[in]: having
[out]: have
-
Итак, вопрос в том, являются ли английские стволовые средства полезными сегодня? Поскольку у нас есть множество инструментов лемматизации для английского языка
-
Если нет, то как мы должны двигаться дальше, чтобы создать надежные лемматизаторы, которые может принимать значения
nounify
,verbify
,adjectify
иadverbify
предварительно обрабатывает? -
Как можно легко масштабировать задачу лемматизации на другие языки которые имеют сходные морфологические структуры, как английский?