Я пытаюсь использовать NLTK, инструментарий на основе естественного языка Стэнфорда. После установки необходимых файлов я запускаю демонстрационный код: http://www.nltk.org/index.html
>>> import nltk
>>> sentence = """At eight o'clock on Thursday morning
... Arthur didn't feel very good."""
>>> tokens = nltk.word_tokenize(sentence)
>>> tokens
['At', 'eight', "o'clock", 'on', 'Thursday', 'morning',
"Артур", "сделал", "не", "чувствовать", "очень", "хорошо", "." )
>>> tagged = nltk.pos_tag(tokens)
>>> tagged[0:6]
[('At', 'IN'), ('eight', 'CD'), ("o'clock", 'JJ'), ('on', 'IN'),
( "Четверг", "NNP" ), ( "утро", "NN" )]
>>> entities = nltk.chunk.ne_chunk(tagged)
>>> entities
Затем я получаю сообщение:
LookupError:
===========================================================================
NLTK was unable to find the gs file!
Use software specific configuration paramaters or set the PATH environment variable.
Я попробовал Google, но там никто не скажет, что отсутствует файл gs.