Corpora/stopwords не найдены при импорте библиотеки nltk

Я пытаюсь импортировать пакет nltk в python 2.7

  import nltk
  stopwords = nltk.corpus.stopwords.words('english')
  print(stopwords[:10])

Выполнение этого дает мне следующую ошибку:

LookupError: 
**********************************************************************
Resource 'corpora/stopwords' not found.  Please use the NLTK
Downloader to obtain the resource:  >>> nltk.download()

Итак, поэтому я открываю свой python termin и делал следующее:

import nltk  
nltk.download()

Что дает мне:

showing info https://raw.githubusercontent.com/nltk/nltk_data/gh-pages/index.xml

Однако это, похоже, не останавливается. И запустить его снова по-прежнему дает мне ту же ошибку. Любые мысли, где это идет не так?

Ответ 1

В настоящее время вы пытаетесь загрузить каждый элемент в nltk-данных, так что это может занять много времени. Вы можете попробовать загрузить только те стоп-слова, которые вам нужны:

import nltk
nltk.download('stopwords')

Ответ 2

Некоторые из них были упомянуты здесь Куртом Бурбаки, но в командной строке:

python -m nltk.downloader stopwords

Ответ 3

Вы можете сделать это отдельно в консоли.
Это даст вам результат.

import nltk
nltk.download('stopwords')

Я использовал консоль Jupyter, когда столкнулся с этой проблемой.

Ответ 4

Если ваш компьютер использует прокси для подключения, попробуйте следующее:

import nltk

nltk.set_proxy('http://proxy.example.com:3128', ('USERNAME', 'PASSWORD'))
nltk.download('stopwords')

Ответ 5

Вы можете ввести это в командной строке для Python 3:

python3 -m nltk.downloader stopwords

Ответ 6

Просто запустите эту команду в своем ноутбуке ipython (или любом другом текстовом редакторе /IDE, который вы используете):

import nltk

nltk.download('stopwords')

Он автоматически загрузит файл stopword и распакует его в требуемый каталог.

Ответ 7

введите в командной строке, если вы установили Python 3.

>>python
>>import nltk

это проверить, установлен ли у вас nltk в противном случае установите его с помощью

>>pip install nltk

тогда, если вы хотите установить только каталог стоп-слов, используйте

>>python -m nltk.downloader stopwords

это займет меньше времени по сравнению с установкой всего пакета затем

>> import nltk
>> nltk.download('punkt')

после этого вы готовы использовать стоп-слова в вашем компиляторе