O algoritmo PCA pode ser formulado em termos da matriz de correlação (suponha que os dados já tenham sido normalizados e estamos considerando apenas a projeção no primeiro PC). A função objetivo pode ser escrita como:
Isso é bom e usamos multiplicadores lagrangianos para resolvê-lo, ou seja, reescrevendo-o como:
que é equivalente a
e, portanto, ( veja aqui no Mathworld ) parece ser igual a
Mas isso significa maximizar a distância entre ponto e linha e, pelo que li aqui , isso está incorreto - deve ser , não . Onde está o meu erro?
Ou alguém pode me mostrar o elo entre maximizar a variação no espaço projetado e minimizar a distância entre ponto e linha?
pca
optimization
Cam.Davidson.Pilon
fonte
fonte
Respostas:
Seja uma matriz de dados centralizada com n observações em linhas. Seja Σ = X ⊤ X / ( n - 1 ) seja sua matriz de covariância. Seja w um vetor unitário especificando um eixo no espaço variável. Queremos que w seja o primeiro eixo principal.X n Σ=X⊤X/(n−1) w w
fonte