O PCA é considerado um procedimento linear, no entanto:
onde . Isto quer dizer que os autovetores obtidos pelos PCAs nas matrizes de dados X i não resumir para igualar os autovetores obtidos pela PCA na soma dos dados matrizes X i . Mas não é a definição de uma função linear f que:
Então, por que o PCA é considerado "linear" se não satisfaz essa condição muito básica de linearidade?
Respostas:
Quando dizemos que PCA é um método linear, nos referimos ao mapeamento de redução de dimensionalidade do espaço de alta dimensão R p para um espaço de dimensão inferior R k . No PCA, esse mapeamento é dado pela multiplicação de x pela matriz dos vetores próprios do PCA e, portanto, é manifestamente linear (a multiplicação da matriz é linear): z = f ( x ) = V ⊤ x . Isso contrasta com os métodos não lineares de redução de dimensionalidade , onde o mapeamento de redução de dimensionalidade pode ser não linear.f:x↦z Rp Rk x
Por outro lado, os melhores vectores próprios V ∈ R p x k são calculados a partir dos dados de matriz X ∈ R n × p usando o que chamado de P C A ( ) na sua pergunta: V = P C Um ( X ) , e esse mapeamento é certamente não linear: envolve a computação de vetores próprios da matriz de covariância, que é um procedimento não linear. (Como um exemplo trivial, multiplicando X por 2k V∈Rp×k X∈Rn×p PCA()
fonte
"Linear" pode significar muitas coisas e não é empregado exclusivamente de maneira formal.
O PCA geralmente não é definido como uma função no sentido formal e, portanto, não é esperado que atenda aos requisitos de uma função linear quando descrito como tal. É mais frequentemente descrito, como você disse, como um procedimento e, às vezes, como um algoritmo (embora eu não goste desta última opção). Diz-se frequentemente que é linear de uma maneira informal, não bem definida.
fonte
O PCA fornece / é uma transformação linear.
Como comparação, um exemplo muito simples de um processo que usa uma transformação linear, mas não é uma transformação linear em si:
e
mas
essa duplicação do ângulo, que envolve o cálculo de ângulos, não é linear e é análoga à afirmação da ameba, de que o cálculo do vetor próprio não é linear
fonte