Я хотел использовать wordmet lemmatizer в python, и я узнал, что по умолчанию pos является NOUN и что он не выводит правильную лемму для глагола, если только тег pos явно не указан как VERB.
Мой вопрос заключается в том, что лучший результат для выполнения вышеуказанной лемматизации точно?
Я сделал пометку pos с помощью nltk.pos_tag
, и я потерял интеграцию меток tree bank pos с тегами, совместимыми с wordnet. Пожалуйста, помогите
from nltk.stem.wordnet import WordNetLemmatizer
lmtzr = WordNetLemmatizer()
tagged = nltk.pos_tag(tokens)
Я получаю выходные теги в NN, JJ, VB, RB. Как изменить их на теги, совместимые с wordnet?
Также мне нужно тренировать nltk.pos_tag()
с помощью тега-тега или я могу использовать его непосредственно для своих данных для оценки?