Получение ошибки 405 при попытке загрузить данные nltk

Когда я попробую приведенный ниже код

python -c "import nltk; nltk.download('punkt'); 
nltk.download('averaged_perceptron_tagger'); 
nltk.download('maxent_treebank_pos_tagger'); 
nltk.download('wordnet')"

консоль говорит

[nltk_data] Error loading punkt: HTTP Error 405: Not allowed.
[nltk_data] Error loading averaged_perceptron_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading maxent_treebank_pos_tagger: HTTP Error 405:
[nltk_data]     Not allowed.
[nltk_data] Error loading wordnet: HTTP Error 405: Not allowed.

Ответ 1

Это вызвано отсутствием ссылки на исходный файл Github.

Между тем решение о стоп-секунде было бы вручную загрузить файл:

PATH_TO_NLTK_DATA=/home/username/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/ $PATH_TO_NLTK_DATA

Мы работаем над поиском альтернативы загрузке данных и моделей.

Между тем, @всем, пожалуйста, помогите проверить, что ваш script и убедитесь, что вы не перегружаете загрузку данных! Спасибо заранее!

Пожалуйста, проверьте https://github.com/nltk/nltk/issues/1787 для получения последних обновлений по этой проблеме.

Ответ 2

Для MacOSX - небольшая модификация вышеупомянутого ответа:

PATH_TO_NLTK_DATA=~/nltk_data/
wget https://github.com/nltk/nltk_data/archive/gh-pages.zip
unzip gh-pages.zip
mv nltk_data-gh-pages/packages/ $PATH_TO_NLTK_DATA

Обратите внимание, что это большая загрузка (~ 700 МБ).