У меня есть данные, исходящие из csv, который содержит несколько тысяч столбцов и десять тысяч (или около того) строк. Внутри каждого столбца данные одного типа, но разные столбцы имеют данные разного типа *. Раньше я собирал данные из numpy и сохранял их на диске, но это довольно медленно, особенно потому, что обычно я хочу загрузить некоторое подмножество столбцов, а не все из них.
Я хочу поместить данные в hdf5 с помощью pytables, и первым моим подходом было размещение данных в одной таблице с одним столбцом hdf5 на столбец csv. К сожалению, это не сработало, я предполагаю из-за ограничения 512 (мягких) столбцов.
Каков разумный способ хранения этих данных?
* Я имею в виду, тип данных после его преобразования из текста.