Eu quero transformar meus dados modo que as variações sejam uma e as covariâncias sejam zero (ou seja, eu quero branquear os dados). Além disso, os meios devem ser zero.
Sei que chegarei lá fazendo a padronização Z e a transformação PCA, mas em que ordem devo fazê-las?
Devo acrescentar que a transformação de clareamento composta deve ter o formato .
Existe um método semelhante ao PCA que faz exatamente essas duas transformações e me fornece uma fórmula do formulário acima?
pca
linear-algebra
Angelorf
fonte
fonte
Respostas:
Primeiro, você obtém o zero médio subtraindo a média .μ = 1N∑ x
Segundo, você obtém as covariâncias zero ao fazer o PCA. Se é a matriz de covariância de seus dados, o PCA equivale a executar uma composição automática , onde está uma matriz de rotação ortogonal composta por vetores próprios de e é uma matriz diagonal com valores próprios na diagonal. Matrix fornece uma rotação necessária para correlacionar os dados (ou seja, mapeia os recursos originais para os principais componentes).Σ Σ = U Λ U⊤ você Σ Λ você⊤
Terceiro, após a rotação, cada componente terá variação dada por um valor próprio correspondente. Portanto, para tornar as variações iguais a , você precisa dividir pela raiz quadrada de .1 Λ
No conjunto, a transformação de clareamento é . Você pode abrir os colchetes para obter o formulário que está procurando.x ↦ Λ- 1 / 2você⊤( x - μ )
Atualizar. Consulte também este tópico posterior para obter mais detalhes: Qual é a diferença entre o clareamento de ZCA e clareamento de PCA?
fonte