У меня есть большой набор строк, которые я использую для изучения естественного языка, и я бы хотел иметь хороший способ сохранить его в Python.
Я мог бы использовать pickle, но загрузка всего списка в память тогда была бы невозможной (я считаю), поскольку она имеет размер около 10 ГБ, и у меня не так много основной памяти. В настоящее время у меня есть список, хранящийся в библиотеке полки... Полка индексируется строками "0", "1",..., "n", которая немного неуклюжа.
Существуют ли более удобные способы хранения такого объекта в одном файле и все еще имеют случайный (ish) доступ к нему?
Возможно, лучший вариант - разбить его на несколько списков.
Спасибо!