NumPy: использование loadtxt или genfromtxt для чтения оборванной структуры

Мне нужно прочитать ASCII файл в Python, где выдержка из файла выглядит так:

E     M S T   N...
...
9998  1 1 128 10097 10098 10199 10198 20298 20299 20400 20399
9999  1 1 128 10098 10099 10200 10199 20299 20300 20401 20400
10000 1 1 128 10099 10100 10201 10200 20300 20301 20402 20401
10001 1 2  44  2071  2172 12373 12272
10002 1 2  44  2172  2273 12474 12373

В идеале это должно следовать схеме NumPy:

array([(9998, 1, 1, 128, (10097, 10098, 10199, 10198, 20298, 20299, 20400, 20399)),
       (9999, 1, 1, 128, (10098, 10099, 10200, 10199, 20299, 20300, 20401, 20400)),
       (10000, 1, 1, 128, (10099, 10100, 10201, 10200, 20300, 20301, 20402, 20401)),
       (10001, 1, 2, 44, (2071, 2172, 12373, 12272)),
       (10002, 1, 2, 44, (2172, 2273, 12474, 12373))], 
      dtype=[('E', '<i4'), ('M', '<i4'), ('S', '<i4'), ('T', '<i4'), ('N', '|O4')])

Где последний объект N, является tuple с целым числом от 2 до 8.

Я хотел бы загрузить эту оборванную структуру, используя np.loadtxt или np.genfromtxt, за исключением того, что я не уверен, что это возможно. Любые встроенные подсказки, или мне нужно сделать пользовательский split-cast-for-loop?

dt=[('E', '<i4'), ('M', '<i4'), ('S', '<i4'), ('T', '<i4'), ('N', '|O4')] arr = numpy.loadtxt('data.txt', dtype=dt) # Correctly reads the first 4 columns with open('data.txt') as input_file: for (line_num, line) in enumerate(input_file): arr[line_num]['N'] = tuple(int(x) for x in line.split()[4:]) # Manual setting of the tuple column

[(9998, 1, 1, 128, (10097, 10098, 10199, 10198, 20298, 20299, 20400, 20399)) (9999, 1, 1, 128, (10098, 10099, 10200, 10199, 20299, 20300, 20401, 20400)) (10000, 1, 1, 128, (10099, 10100, 10201, 10200, 20300, 20301, 20402, 20401)) (10001, 1, 2, 44, (2071, 2172, 12373, 12272)) (10002, 1, 2, 44, (2172, 2273, 12474, 1237))]

Ответ 1