Я пытаюсь прочитать несколько большой набор данных, используя функции panda
read_csv
или read_stata
, но я продолжаю работать в Memory Error
s. Каков максимальный размер кадра данных? Я понимаю, что данные должны быть в порядке, пока данные вписываются в память, что не должно быть проблемой для меня. Что еще может вызвать ошибку памяти?
В контексте я пытаюсь прочитать в Обзор потребительских финансов 2007, как в формате ASCII (используя read_csv
), так и в формате Stata (используя read_stata
). Файл составляет около 200 МБ, как dta и около 1,2 ГБ, как ASCII, и его открытие в Stata говорит мне, что имеется 5,800 переменных/столбцов для 22 000 наблюдений/строк.