Iterando sobre uma matriz numpy

135

Existe uma alternativa menos detalhada para isso:

for x in xrange(array.shape[0]):
    for y in xrange(array.shape[1]):
        do_stuff(x, y)

Eu vim com isso:

for x, y in itertools.product(map(xrange, array.shape)):
    do_stuff(x, y)

O que economiza um recuo, mas ainda é muito feio.

Espero algo parecido com este pseudocódigo:

for x, y in array.indices:
    do_stuff(x, y)

Existe algo assim?

Ram Rachum
fonte
Estou no python 2.7 e estou usando sua solução com os itertools; eu li nos comentários que o uso do itertools será mais rápido. no entanto, (talvez porque eu esteja na versão 2.7), também tive que descompactar o mapa no loop for. for x, y in itertools.product(*map(xrange, array.shape)):
ALM
Há uma página na Referência do NumPy chamada "Iterando sobre matrizes": docs.scipy.org/doc/numpy/reference/arrays.nditer.html
Casey
relacionado: stackoverflow.com/questions/29493183/…
Eulenfuchswiesel

Respostas:

187

Eu acho que você está procurando o ndenumerate .

>>> a =numpy.array([[1,2],[3,4],[5,6]])
>>> for (x,y), value in numpy.ndenumerate(a):
...  print x,y
... 
0 0
0 1
1 0
1 1
2 0
2 1

Em relação ao desempenho. É um pouco mais lento que a compreensão de uma lista.

X = np.zeros((100, 100, 100))

%timeit list([((i,j,k), X[i,j,k]) for i in range(X.shape[0]) for j in range(X.shape[1]) for k in range(X.shape[2])])
1 loop, best of 3: 376 ms per loop

%timeit list(np.ndenumerate(X))
1 loop, best of 3: 570 ms per loop

Se você estiver preocupado com o desempenho, poderá otimizar um pouco mais olhando a implementação de ndenumerate, que faz duas coisas, convertendo em uma matriz e fazendo um loop. Se você souber que possui uma matriz, poderá chamar o .coordsatributo do iterador plano.

a = X.flat
%timeit list([(a.coords, x) for x in a.flat])
1 loop, best of 3: 305 ms per loop
SiggyF
fonte
1
Observe que isso funciona, mas é incrivelmente lento. Você é melhor iterando manualmente.
28716 Marty
43

Se você precisar apenas dos índices, tente numpy.ndindex:

>>> a = numpy.arange(9).reshape(3, 3)
>>> [(x, y) for x, y in numpy.ndindex(a.shape)]
[(0, 0), (0, 1), (0, 2), (1, 0), (1, 1), (1, 2), (2, 0), (2, 1), (2, 2)]
remetente
fonte
15

veja o editor

import numpy as np
Y = np.array([3,4,5,6])
for y in np.nditer(Y, op_flags=['readwrite']):
    y += 3

Y == np.array([6, 7, 8, 9])

y = 3não iria funcionar, use y *= 0e em y += 3vez disso.

C19
fonte
2
ou use y [...] = 3
Donald Hobson