Matriz de covariância inversa vs matriz de covariância em PCA
10
No PCA, faz diferença se escolhermos os principais componentes da matriz de covariância inversa OU se deixarmos cair autovetores da matriz de covariância correspondentes a grandes valores próprios?
Observe que, para a matriz de covariância definida positiva a precisão é Σ - 1 = U D - 1 U ' .Σ = U D U′Σ- 1= U D- 1você′
Portanto, os vetores próprios permanecem os mesmos, mas os valores próprios da precisão são os recíprocos dos valores próprios da covariância. Isso significa que os maiores valores próprios da covariância serão os menores valores próprios da precisão. Como você tem o inverso, a definição positiva garante que todos os autovalores sejam maiores que zero.
Portanto, se você reter os autovetores relacionados aos menores autovalores da precisão, isso corresponderá ao PCA comum. Como já tomamos os recíprocos ( D - 1 ), apenas a raiz quadrada dos autovalores de precisão deve ser usada para concluir o clareamento dos dados transformados.kD- 1
+1, mas acho que sua frase "Então, sim, faz diferença" pode ser confusa para o OP; o Q não é muito claro, mas acho que eles estavam perguntando se existe uma diferença entre selecionar os maiores valores próprios da matriz inv cov e selecionar os menores valores próprios (= descartar os maiores) da matriz cov. Para esta pergunta, a resposta é que é equivalente. Então, talvez, se você simplesmente cortar esta frase, a resposta será mais clara.
ameba
Obrigado, entendi o que você quer dizer e editei de acordo.
conjeturas
Na verdade, a última frase foi boa, eu teria mantido!
ameba
@conjectures Obrigado, essa é a explicação perfeita.
Mustafa Arif
0
Além disso, a matriz de covariância inversa é proporcional à correlação parcial entre os vetores:
Corr(Xi, Xj | (Xothers )
Correlação entre Xi e Xj quando todos os outros são corrigidos, é muito útil para séries temporais.
Além disso, a matriz de covariância inversa é proporcional à correlação parcial entre os vetores:
Correlação entre Xi e Xj quando todos os outros são corrigidos, é muito útil para séries temporais.
fonte