Я пытаюсь ввести полный абзац в свой текстовый процессор, который сначала разбивается на предложения, а затем - на слова.
Я попробовал следующий код, но он не работает,
#text is the paragraph input
sent_text = sent_tokenize(text)
tokenized_text = word_tokenize(sent_text.split)
tagged = nltk.pos_tag(tokenized_text)
print(tagged)
однако это не работает и дает мне ошибки. Итак, как я подделать абзацы в предложения, а затем слова?
Пример абзаца:
Эта вещь, казалось, одолевала и удивляла маленькую темно-коричневую собаку и ранила его в сердце. Он упал в отчаянии на ноги ребенка. Когда удар был повторен, вместе с увещеванием в детских предложениях, он повернулся на спину и с особым видом держал лапы. В то же время с ушами и глазами он предложил маленькую молитву ребенку.
** ПРЕДУПРЕЖДЕНИЕ: ** Это просто случайный текст из Интернета, я не владею вышеуказанным контентом.