Поиск последовательных нулей в массиве numpy

У меня есть следующий массив

  a = [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7,0,10,11]

То, что я хотел бы найти начальный и конечный индекс массива, где значения являются нулями последовательно, для массива над выходом выглядит следующим образом

  [3,8],[12,15],[19]

Я хочу сделать это как можно эффективнее.

Ответ 1

Здесь довольно компактная векторная реализация. Я немного изменил требования, поэтому возвращаемое значение немного больше "numpythonic": оно создает массив с формой (m, 2), где m - количество "прогонов" нулей. Первый столбец - это индекс первого 0 в каждом прогоне, а второй - индекс первого ненулевого элемента после прогона. (Этот шаблон индексации соответствует, например, как работает нарезка и как работает функция range.)

import numpy as np

def zero_runs(a):
    # Create an array that is 1 where a is 0, and pad each end with an extra 0.
    iszero = np.concatenate(([0], np.equal(a, 0).view(np.int8), [0]))
    absdiff = np.abs(np.diff(iszero))
    # Runs start and end where absdiff is 1.
    ranges = np.where(absdiff == 1)[0].reshape(-1, 2)
    return ranges

Например:

In [236]: a = [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7, 0, 10, 11]

In [237]: runs = zero_runs(a)

In [238]: runs
Out[238]: 
array([[ 3,  9],
       [12, 16],
       [19, 20]])

В этом формате просто получить количество нулей в каждом прогоне:

In [239]: runs[:,1] - runs[:,0]
Out[239]: array([6, 4, 1])

Всегда рекомендуется проверять случаи краев:

In [240]: zero_runs([0,1,2])
Out[240]: array([[0, 1]])

In [241]: zero_runs([1,2,0])
Out[241]: array([[2, 3]])

In [242]: zero_runs([1,2,3])
Out[242]: array([], shape=(0, 2), dtype=int64)

In [243]: zero_runs([0,0,0])
Out[243]: array([[0, 3]])

Ответ 2

Вы можете использовать itertools для достижения ожидаемого результата.

from itertools import groupby
a= [1, 2, 3, 0, 0, 0, 0, 0, 0, 4, 5, 6, 0, 0, 0, 0, 9, 8, 7,0,10,11]
b = range(len(a))
for group in groupby(iter(b), lambda x: a[x]):
    if group[0]==0:
        lis=list(group[1])
        print [min(lis),max(lis)]

Ответ 3

Вот пользовательская функция, не уверен, что самая эффективная, но работает:

def getZeroIndexes(li):
  begin = 0
  end = 0
  indexes = []
  zero = False
  for ind,elt in enumerate(li):
    if not elt and not zero:
      begin = ind
      zero = True
    if not elt and zero:
      end = ind
    if elt and zero:
      zero = False
      if begin == end:
        indexes.append(begin)
      else:
        indexes.append((begin, end))

  return indexes