Como você extrai uma coluna de uma matriz multidimensional?

Respostas:

227
>>> import numpy as np
>>> A = np.array([[1,2,3,4],[5,6,7,8]])

>>> A
array([[1, 2, 3, 4],
    [5, 6, 7, 8]])

>>> A[:,2] # returns the third columm
array([3, 7])

Consulte também: "numpy.arange" e "remodelar" para alocar memória

Exemplo: (Alocando uma matriz com modelagem de matriz (3x4))

nrows = 3
ncols = 4
my_array = numpy.arange(nrows*ncols, dtype='double')
my_array = my_array.reshape(nrows, ncols)
Andre Luiz
fonte
8
Levei duas horas para descobrir [:, 2] acho que esse recurso não está na literatura oficial sobre fatiamento?
Niken
O que significa a vírgula?
Phil
3
@Phil [row, col]. a vírgula se separa.
AsheKetchum
11
Como essa resposta pode ter tantos votos positivos? OP nunca disse que é uma matriz numpy
sziraqui
3
para extrair 2 colunas: A [:, [1,3]], por exemplo, extracto de segunda e quarta coluna
Sadalsuud
176

Será que você está usando uma matriz NumPy ? O Python possui o módulo array , mas isso não suporta matrizes multidimensionais. As listas normais de Python também são unidimensionais.

No entanto, se você tiver uma lista bidimensional simples como esta:

A = [[1,2,3,4],
     [5,6,7,8]]

então você pode extrair uma coluna como esta:

def column(matrix, i):
    return [row[i] for row in matrix]

Extraindo a segunda coluna (índice 1):

>>> column(A, 1)
[2, 6]

Ou, alternativamente, simplesmente:

>>> [row[1] for row in A]
[2, 6]
Martin Geisler
fonte
80

Se você tiver uma matriz como

a = [[1, 2], [2, 3], [3, 4]]

Então você extrai a primeira coluna assim:

[row[0] for row in a]

Portanto, o resultado fica assim:

[1, 2, 3]
Andrei Arsenin
fonte
38

Confira!

a = [[1, 2], [2, 3], [3, 4]]
a2 = zip(*a)
a2[0]

é a mesma coisa que acima, exceto, de alguma forma, que o zip faz o trabalho, mas exige matrizes únicas como argumentos, a sintaxe * a descompacta a matriz multidimensional em argumentos de matriz única

Mac D
fonte
7
O que está acima? Lembre-se de que as respostas nem sempre são ordenadas da mesma maneira.
Muhd
2
Isso é limpo, mas pode não ser o mais eficiente se o desempenho for uma preocupação, pois está transpondo toda a matriz.
IceArdor
6
Para sua informação, isso funciona no python 2, mas no python 3 você obtém um objeto gerador, o que é claro que não é subscrito.
Rishabh Agrahari
@RishabhAgrahari De qualquer forma, para fazer este zip no Py3?
CtrlAltF2 15/05/19
2
@WarpDriveEnterprises Sim, você precisará converter o objeto gerador em lista e, em seguida, fazer a assinatura. exemplo:a2 = zip(*a); a2 = list(a2); a2[0]
Rishabh Agrahari 16/05/19
14
def get_col(arr, col):
    return map(lambda x : x[col], arr)

a = [[1,2,3,4], [5,6,7,8], [9,10,11,12],[13,14,15,16]]

print get_col(a, 3)

A função map no Python é outro caminho a percorrer.

Peter Paul
fonte
11
>>> x = arange(20).reshape(4,5)
>>> x array([[ 0,  1,  2,  3,  4],
        [ 5,  6,  7,  8,  9],
        [10, 11, 12, 13, 14],
        [15, 16, 17, 18, 19]])

se você quiser a segunda coluna, você pode usar

>>> x[:, 1]
array([ 1,  6, 11, 16])
simomod
fonte
1
Isso está usando numpy?
Foreever 02/04/19
1
Não consigo encontrar nenhuma documentação arange()no Python3 fora do numpy. Qualquer um?
Kevin W Matthews
10
[matrix[i][column] for i in range(len(matrix))]
renatov
fonte
9

O operador itemgetter também pode ajudar, se você gosta de python com estilo de redução de mapa, em vez de compreensão de lista, por um pouco de variedade!

# tested in 2.4
from operator import itemgetter
def column(matrix,i):
    f = itemgetter(i)
    return map(f,matrix)

M = [range(x,x+5) for x in range(10)]
assert column(M,1) == range(1,11)
Gregg Lind
fonte
1
usar itertools.imap para dados grandes
Paweł Polewicz
A abordagem itemgetter executou cerca de 50x mais rápido que a abordagem de compreensão de lista para o meu caso de uso. Python 2.7.2, o caso de uso foi feito em várias iterações em uma matriz com algumas centenas de linhas e colunas.
Joelpt 19/03/12
7

Você também pode usar isso:

values = np.array([[1,2,3],[4,5,6]])
values[...,0] # first column
#[1,4]

Nota: Isso não está funcionando para a matriz incorporada e não está alinhado (por exemplo, np.array ([[1,2,3], [4,5,6,7]]))

Sergey
fonte
6

Eu acho que você deseja extrair uma coluna de uma matriz como uma matriz abaixo

import numpy as np
A = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])

Agora, se você deseja obter a terceira coluna no formato

D=array[[3],
[7],
[11]]

Então você precisa primeiro fazer da matriz uma matriz

B=np.asmatrix(A)
C=B[:,2]
D=asarray(C)

E agora você pode fazer cálculos com elementos, como faria no Excel.

danielinthelionsden
fonte
1
Embora isso tenha me ajudado muito, acho que a resposta pode ser muito mais curta: 1. A = matriz np ([[1,2,3,4], [5,6,7,8], [9,10, 11,12]]) 2. A [:, 1] >> array ([2, 6, 10])
Ufos
6

digamos que temos n X mmatriz ( nlinhas e mcolunas) digamos 5 linhas e 4 colunas

matrix = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16],[17,18,19,20]]

Para extrair as colunas em python, podemos usar a compreensão de lista como esta

[ [row[i] for row in matrix] for in range(4) ]

Você pode substituir 4 pelo número de colunas que sua matriz tiver. O resultado é

[ [1,5,9,13,17],[2,10,14,18],[3,7,11,15,19],[4,8,12,16,20] ]

Serge_k
fonte
Isso cria uma lista totalmente nova?
Kevin W Matthews
5
array = [[1,2,3,4],[5,6,7,8],[9,10,11,12],[13,14,15,16]]

col1 = [val[1] for val in array]
col2 = [val[2] for val in array]
col3 = [val[3] for val in array]
col4 = [val[4] for val in array]
print(col1)
print(col2)
print(col3)
print(col4)

Output:
[1, 5, 9, 13]
[2, 6, 10, 14]
[3, 7, 11, 15]
[4, 8, 12, 16]
Lee
fonte
4

Mais uma maneira de usar matrizes

>>> from numpy import matrix
>>> a = [ [1,2,3],[4,5,6],[7,8,9] ]
>>> matrix(a).transpose()[1].getA()[0]
array([2, 5, 8])
>>> matrix(a).transpose()[0].getA()[0]
array([1, 4, 7])
Shashwat
fonte
3

Se você tiver uma matriz bidimensional em Python (não numpy), poderá extrair todas as colunas dessa forma,

data = [
['a', 1, 2], 
['b', 3, 4], 
['c', 5, 6]
]

columns = list(zip(*data))

print("column[0] = {}".format(columns[0]))
print("column[1] = {}".format(columns[1]))
print("column[2] = {}".format(columns[2]))

A execução desse código produzirá,

>>> print("column[0] = {}".format(columns[0]))
column[0] = ('a', 'b', 'c')

>>> print("column[1] = {}".format(columns[1]))
column[1] = (1, 3, 5)

>>> print("column[2] = {}".format(columns[2]))
column[2] = (2, 4, 6)

Obviamente, você pode extrair uma única coluna por índice (por exemplo columns[0])

Russell
fonte
2

Apesar de usar zip(*iterable)para transpor uma lista aninhada, você também pode usar o seguinte se as listas aninhadas variarem de comprimento:

map(None, *[(1,2,3,), (4,5,), (6,)])

resulta em:

[(1, 4, 6), (2, 5, None), (3, None, None)]

A primeira coluna é assim:

map(None, *[(1,2,3,), (4,5,), (6,)])[0]
#>(1, 4, 6)
Lorenz Lo Sauer
fonte
2

Bem, um pouco tarde ...

Caso o desempenho seja importante e seus dados tenham formato retangular, você também poderá armazená-los em uma dimensão e acessar as colunas fatiando regularmente, por exemplo ...

A = [[1,2,3,4],[5,6,7,8]]     #< assume this 4x2-matrix
B = reduce( operator.add, A ) #< get it one-dimensional

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx::dimX]

def row1d( matrix, dimX, rowIdx ):
  return matrix[rowIdx:rowIdx+dimX] 

>>> column1d( B, 4, 1 )
[2, 6]
>>> row1d( B, 4, 1 )
[2, 3, 4, 5]

O interessante é que isso é realmente rápido. No entanto , índices negativos não funcionam aqui! Portanto, você não pode acessar a última coluna ou linha pelo índice -1.

Se você precisar de indexação negativa, poderá ajustar um pouco as funções do acessador, por exemplo

def column1d( matrix, dimX, colIdx ):
  return matrix[colIdx % dimX::dimX]

def row1d( matrix, dimX, dimY, rowIdx ):
  rowIdx = (rowIdx % dimY) * dimX
  return matrix[rowIdx:rowIdx+dimX]
Zappotek
fonte
Eu verifiquei esse método e o custo de recuperar a coluna é muito mais barato do que o aninhado para loops. No entanto, reduzir uma matriz 2d para 1d é caro se a matriz for grande, digamos 1000 * 1000.
Zhongjun 'Mark' Jin
2

Se você quiser pegar mais do que apenas uma coluna, use fatia:

 a = np.array([[1, 2, 3],[4, 5, 6],[7, 8, 9]])
    print(a[:, [1, 2]])
[[2 3]
[5 6]
[8 9]]
Molina12
fonte
2

Prefiro a próxima dica: ter a matriz nomeada matrix_ae usar column_number, por exemplo:

import numpy as np
matrix_a = np.array([[1,2,3,4],[5,6,7,8],[9,10,11,12]])
column_number=2

# you can get the row from transposed matrix - it will be a column:
col=matrix_a.transpose()[column_number]
Vik Ermolenko
fonte
1

Basta usar transpose (), para que as colunas sejam tão fáceis quanto as linhas

matrix=np.array(originalMatrix).transpose()
print matrix[NumberOfColum]
David Tatis
fonte
0

Todas as colunas de uma matriz em uma nova lista:

N = len(matrix) 
column_list = [ [matrix[row][column] for row in range(N)] for column in range(N) ]
user136036
fonte