У меня есть список предложений:
text = ['cant railway station','citadel hotel',' police stn'].
Мне нужно сформировать пары bigram и сохранить их в переменной. Проблема в том, что когда я это делаю, я получаю пару предложений вместо слов. Вот что я сделал:
text2 = [[word for word in line.split()] for line in text]
bigrams = nltk.bigrams(text2)
print(bigrams)
что дает
[(['cant', 'railway', 'station'], ['citadel', 'hotel']), (['citadel', 'hotel'], ['police', 'stn'])
Невозможно, чтобы железнодорожная станция и гостиница-цитадель составляли один большой. Я хочу
[([cant],[railway]),([railway],[station]),([citadel,hotel]), and so on...
Последнее слово первого предложения не должно сливаться с первым словом второго предложения. Что делать, чтобы заставить его работать?