Sei como calcular matematicamente PCA e SVD e sei que ambos podem ser aplicados à regressão de mínimos quadrados lineares.
A principal vantagem do SVD matematicamente parece ser que ele pode ser aplicado a matrizes não quadradas.
Ambos focam na decomposição da matrizAlém da vantagem do SVD mencionada, existem vantagens ou idéias adicionais fornecidas usando o SVD sobre o PCA?
Estou realmente procurando pela intuição e não por diferenças matemáticas.
pca
least-squares
svd
Baz
fonte
fonte
advantage... SVD over PCA
- svd e PCA não podem ser comparados como uma operação matemática e um método analítico de dados. Sua pergunta pode ser sobre maneiras de executar o PCA ? Ou o que você está perguntando?Respostas:
Como @ttnphns e @ nick-cox disseram, SVD é um método numérico e PCA é uma abordagem de análise (como mínimos quadrados). Você pode executar o PCA usando SVD, ou o PCA fazendo a decomposição em si próprio de (ou ), ou o PCA usando muitos outros métodos, assim como é possível resolver mínimos quadrados com uma dúzia de algoritmos diferentes como o método de Newton ou descida de gradiente ou SVD etc.X X TXTX XXT
Portanto, não há "vantagem" para o SVD sobre o PCA, porque é como perguntar se o método de Newton é melhor que o mínimo de quadrados: os dois não são comparáveis.
fonte
A questão é realmente perguntar se você deve fazer a normalização do Z-score das colunas antes de aplicar o SVD. Isso ocorre porque o PCA é a transformação acima, seguida pelo SVD. Às vezes, fazer a normalização é bastante prejudicial. Se seus dados são, por exemplo, contagens de palavras (transformadas) positivas, subtrair a média é definitivamente prejudicial. Isso ocorre porque os zeros que representam a ausência de uma palavra em um documento serão mapeados para números negativos de alta magnitude. Em problemas lineares, a magnitude mais alta deve ser usada para representar o intervalo em que seus recursos são mais sensíveis. Também dividir pelo desvio padrão é prejudicial para esse tipo de dados.
fonte