Мне нужно взять текстовый файл с одним словом. Затем мне нужно найти имена, определения и примеры lemma_names, используя wordnet. Я прочитал книгу: "Обработка текста на Python с помощью Cookbook NLTK 2.0", а также "Обработка естественного языка с использованием NLTK", чтобы помочь мне в этом направлении. Хотя я понял, как это можно сделать с помощью терминала, я не могу сделать то же самое с помощью текстового редактора.
Например, если входной текст имеет слово "flabbergasted", выход должен быть таким образом:
ошарашил (глагол) flabbergast, boggle, чаша, преодолеваемая с изумлением; "Это ошеломило ум!" (прилагательное) ошеломленное, ошеломленное, ошеломленное, ошеломленное, громовое, ошеломленное, ошарашенное - как будто безумное удивление и удивление; "Круг полицейского был ошеломлен ее отрицанием того, что видел несчастный случай"; "ошеломленные ольдермены были безмолвными"; "был потрясен новостями о его продвижении"
Синтесы, определения и примеры предложений получены из WordNet напрямую!
У меня есть следующий фрагмент кода:
from __future__ import division
import nltk
from nltk.corpus import wordnet as wn
tokenizer = nltk.data.load('tokenizers/punkt/english.pickle')
fp = open("inpsyn.txt")
data = fp.read()
#to tokenize input text into sentences
print '\n-----\n'.join(tokenizer.tokenize(data))# splits text into sentences
#to tokenize the tokenized sentences into words
tokens = nltk.wordpunct_tokenize(data)
text = nltk.Text(tokens)
words = [w.lower() for w in text]
print words #to print the tokens
for a in words:
print a
syns = wn.synsets(a)
print "synsets:", syns
for s in syns:
for l in s.lemmas:
print l.name
print s.definition
print s.examples
Я получаю следующий вывод:
flabbergasted
['flabbergasted']
flabbergasted
synsets: [Synset('flabbergast.v.01'), Synset('dumbfounded.s.01')]
flabbergast
boggle
bowl_over
overcome with amazement
['This boggles the mind!']
dumbfounded
dumfounded
flabbergasted
stupefied
thunderstruck
dumbstruck
dumbstricken
as if struck dumb with astonishment and surprise
['a circle of policement stood dumbfounded by her denial of having seen the accident', 'the flabbergasted aldermen were speechless', 'was thunderstruck by the news of his promotion']
Есть ли способ получить часть речи вместе с группой имен леммы?