Меня интересуют python mining массивы данных, слишком большие, чтобы сидеть в ОЗУ, но сидеть в одном HD.
Я понимаю, что я могу экспортировать данные в виде hdf5 файлов, используя pytables. Кроме того, numexpr допускает некоторые базовые вычисления вне ядра.
Что будет дальше? Мини-дозирование, когда это возможно, и полагаться на результаты линейной алгебры, чтобы разложить вычисление, когда мини-пакет не может быть использован?
Или есть некоторые инструменты более высокого уровня, которые я пропустил?
Спасибо за понимание,