Я хотел бы загрузить большой текстовый файл (около 1 GB с 3 * 10 ^ 6 строк и 10 - 100 столбцов) в виде 2D np-массива, содержащего строки. Однако, кажется, что numpy.loadtxt() принимает по умолчанию только float. Можно ли указать другой тип данных для всего массива? Я пробовал следующее без везения:
loadedData = np.loadtxt(address, dtype=np.str)
Появляется следующее сообщение об ошибке:
/Library/Python/2.7/site-packages/numpy-1.8.0.dev_20224ea_20121123-py2.7-macosx-10.8-x86_64.egg/numpy/lib/npyio.pyc in loadtxt(fname, dtype, comments, delimiter, converters, skiprows, usecols, unpack, ndmin)
833 fh.close()
834
--> 835 X = np.array(X, dtype)
836 # Multicolumn data are returned with shape (1, N, M), i.e.
837 # (1, 1, M) for a single row - remove the singleton dimension there
ValueError: cannot set an array element with a sequence
Любые идеи? (Я не знаю точное количество столбцов в моем файле заранее.)