Existem muitos posts neste SE que discutem abordagens robustas para a análise de componentes principais (PCA), mas não consigo encontrar uma única boa explicação de por que o PCA é sensível a discrepâncias em primeiro lugar.
26
Existem muitos posts neste SE que discutem abordagens robustas para a análise de componentes principais (PCA), mas não consigo encontrar uma única boa explicação de por que o PCA é sensível a discrepâncias em primeiro lugar.
Respostas:
Como o PCA minimiza as normas (ou seja, normas quadráticas), ele tem os mesmos problemas de mínimos quadrados ou é adequado a um gaussiano por ser sensível a valores extremos. Por causa da quadratura dos desvios dos valores discrepantes, eles dominam a norma total e, portanto, acionam os componentes do PCA.L2
fonte