Я использую Lemmatizer Wordnet через NLTK на Brown Corpus (чтобы определить, используются ли в нем существительные больше в их единственной форме или их множественной форме).
т.е. from nltk.stem.wordnet import WordNetLemmatizer
l = WordnetLemmatizer()
Я заметил, что даже самые простые запросы, такие как приведенные ниже, занимают довольно много времени (по крайней мере, секунду или два). l("cats")
Предположительно, это связано с тем, что для каждого запроса необходимо создать веб-соединение для Wordnet. Мне интересно, есть ли способ по-прежнему использовать Wordnet Lemmatizer, но он работает намного быстрее? Например, поможет ли мне вообще скачать Wordnet на мою машину? Или любые другие предложения?
Я пытаюсь выяснить, может ли Lemmatizer Wordnet ускоряться, а не пытаться использовать другой lemmatizer, потому что я нашел, что он работает лучше всего среди других, таких как Porter и Lancaster.