Por que o PCA é sensível a valores discrepantes?

26

Existem muitos posts neste SE que discutem abordagens robustas para a análise de componentes principais (PCA), mas não consigo encontrar uma única boa explicação de por que o PCA é sensível a discrepâncias em primeiro lugar.

Psi
fonte
5
Porque a contribuição da norma L2 é muito alta para discrepantes. Então, ao minimizar a norma L2 (que é o que o PCA tenta fazer), esses pontos serão mais difíceis de ajustar do que os pontos mais próximos da vontade média.
mathreadler
Esta resposta diz tudo o que você precisa. Apenas imagine um outlier e leia atentamente.
S. Kolassa - Restabelece Monica

Respostas:

35

L2YmnXkn

YXAF2=j=1mYjXAj.2
AF

Como o PCA minimiza as normas (ou seja, normas quadráticas), ele tem os mesmos problemas de mínimos quadrados ou é adequado a um gaussiano por ser sensível a valores extremos. Por causa da quadratura dos desvios dos valores discrepantes, eles dominam a norma total e, portanto, acionam os componentes do PCA. L2

sega_sai
fonte