Я хочу читать в CSV файле standard-ascii в numpy, который состоит из поплавков и строк.
например.
ZINC00043096,C.3,C1,-0.1540,methyl
ZINC00043096,C.3,C2,0.0638,methylene
ZINC00043096,C.3,C4,0.0669,methylene
ZINC00090377,C.3,C7,0.2070,methylene
...
Что бы я ни пытался, результирующий массив выглядел бы как
Например,
all_data = np.genfromtxt(csv_file, dtype=None, delimiter=',')
[(b'ZINC00043096', b'C.3', b'C1', -0.154, b'methyl')
(b'ZINC00043096', b'C.3', b'C2', 0.0638, b'methylene')
(b'ZINC00043096', b'C.3', b'C4', 0.0669, b'methylene')
Тем не менее, я хочу сохранить шаг для преобразования байтовой строки и задавался вопросом, как я могу читать строки строки как регулярную строку напрямую.
Я пробовал несколько вещей из документации numpy.genfromtxt(), например, dtype='S,S,S,f,S'
или dtype='a25,a25,a25,f,a25'
, но здесь ничего не помогло.
Я боюсь, но я думаю, что просто не понимаю, как действительно работает преобразование dtype... Было бы хорошо, если бы вы могли дать мне какой-то намек здесь!
Спасибо