Я ищу способ разделить текст на n-граммы. Обычно я бы сделал что-то вроде:
import nltk
from nltk import bigrams
string = "I really like python, it pretty awesome."
string_bigrams = bigrams(string)
print string_bigrams
Я знаю, что nltk предлагает только биграммы и триграммы, но есть ли способ разделить мой текст на четыре грамма, пять грамм или даже на сто граммов?
Спасибо!