O que são os componentes principais "rotacionados" e "não rotacionados", uma vez que o PCA sempre gira os eixos das coordenadas?

13

Tanto quanto eu entendo, os componentes principais são obtidos girando os eixos de coordenadas para alinhá-los com as direções de variação máxima.

No entanto, continuo lendo sobre "componentes principais não rotacionados" e meu software de estatística (SAS) me fornece componentes principais rotacionados em varimax, bem como os componentes não rotacionados. Aqui estou confuso: quando computamos componentes principais, os eixos já estão girados; então por que é necessária outra rotação? E o que significa "componente principal não rotacionado"?

Srewashi Lahiri
fonte
1
As perguntas exclusivamente sobre como o software funciona estão fora do tópico aqui, mas você pode ter uma pergunta estatística real oculta aqui. Você pode editar sua pergunta para esclarecer o problema estatístico subjacente. Você pode descobrir que, ao entender os conceitos estatísticos envolvidos, os elementos específicos do software são evidentes ou pelo menos fáceis de obter na documentação.
gung - Restabelece Monica
1
@gung - Minha pergunta não é sobre software. Pode ser que eu coloquei errado. Tudo o que eu queria saber é que, de acordo com meu entendimento, só obtemos componentes principais quando giramos os eixos na linha de variação máxima. Então, qual é o componente principal não rotacionado, um termo que encontrei em várias páginas explicando sobre o PCA. Por favor, deixe-me saber se minha pergunta ainda é ambígua.
Srewashi Lahiri
Certamente parece que é sobre SAS. Caso contrário, eu editaria o seu Q para remover as referências ao SAS e explicar novamente sua pergunta em termos neutros de software. Você também pode estar interessado em ler este tópico .
gung - Restabelece Monica
Mencionei o SAS porque estava realizando a análise nesse software. Mesmo se você desconsiderar a palavra, pode me fornecer uma explicação para minha versão editada da pergunta. Também passei pela discussão. Por favor, corrija-me se estiver errado. Quando calculamos componentes principais, isso significa que os eixos já estão girados. Portanto, outra notação varimax não é necessária. É assim mesmo? Estou realmente confuso sobre esta parte. Muito obrigado antecipadamente
Srewashi Lahiri
2
Srewashi, tomei a liberdade de reescrever substancialmente sua pergunta com base nos seus esclarecimentos nos comentários. Eu acho que é uma boa pergunta, +1. Verifique se minhas edições refletem suas intenções! Você sempre pode editar mais. Cc para @gung.
Ameba diz Reinstate Monica

Respostas:

15

Essa será uma resposta não técnica.

Você está certo: PCA é essencialmente uma rotação dos eixos de coordenadas, escolhida de modo que cada eixo bem-sucedido capture a maior variação possível.

Em algumas disciplinas (como, por exemplo, psicologia), as pessoas gostam de aplicar a PCA para interpretar os eixos resultantes. Ou seja, eles querem poder dizer que o eixo principal nº 1 (que é uma certa combinação linear de variáveis ​​originais) tem algum significado particular. Para adivinhar esse significado, eles examinariam os pesos na combinação linear. No entanto, esses pesos geralmente são confusos e nenhum significado claro pode ser discernido.

Nesses casos, às vezes as pessoas optam por mexer um pouco com a solução vanilla PCA. Eles pegam certo número de eixos principais (que são considerados "significativos" por algum critério) e os rodam adicionalmente , tentando obter alguma "estrutura simples" - isto é, combinações lineares que seriam mais fáceis de interpretar. Existem algoritmos específicos que procuram a estrutura mais simples possível; um deles é chamado varimax. Após a rotação varimax, os componentes sucessivos não capturam mais a maior variação possível! Esse recurso do PCA é interrompido executando a rotação varimax adicional (ou qualquer outra).

Portanto, antes de aplicar a rotação varimax, você tem componentes principais "não rotacionados". E depois, você obtém componentes principais "rotacionados". Em outras palavras, essa terminologia refere-se ao pós-processamento dos resultados do PCA e não à própria rotação do PCA.


Tudo isso é um pouco complicado pelo fato de que o que é rotacionado são cargas e não eixos principais como tais. No entanto, para os detalhes matemáticos , indico você (e qualquer leitor interessado) à minha longa resposta aqui: O PCA é seguido por uma rotação (como o varimax) ainda é PCA?

ameba diz Restabelecer Monica
fonte
Ainda não encontrei uma explicação melhor e mais clara. Também passei pelo outro link que você forneceu, mas ainda estou para decifrá-lo na totalidade. Se eu entendi direito, os componentes principais não rotacionados já são ortogonais e não correlacionados. Aqui eu tenho um pouco de confusão - como os PCs correspondem à variação máxima sucessiva, é necessário que, depois que o primeiro PC seja encontrado, a segunda linha de variação máxima (segundo PC) esteja em 90 graus (ortogonal) em relação ao primeiro e assim por diante. ?
Srewashi Lahiri 14/07/2015
Isso mesmo: os componentes principais "não rotacionados" não são correlacionados e os eixos principais "não rotacionados" são ortogonais. E sim, é necessário que os eixos principais sucessivos sejam ortogonais e os componentes principais não correlacionados com os anteriores (pode-se provar matematicamente). A propósito, se você acha que essa (ou qualquer outra) resposta resolve o problema, você pode "aceitá-lo" clicando no visto verde à esquerda. Depois de atingir 15 reputação, você também poderá votar novamente nas respostas que achar úteis (acho que atualmente você não pode votar novamente).
Ameba diz Reinstate Monica
+1. what gets rotated are loadings and not principal axes as suchEu acrescentaria que essa é uma noção técnica. Teoricamente, esses dois tipos de rotação são justaposicionais. No PCA, rotacionamos para encontrar a base ortogonal específica (aquela com os maiores valores de autovalores). No varimax, giramos para encontrar outra base ortogonal específica (com a estrutura mais interpetável). Poderíamos fazer qualquer tipo de base ortogonal.
ttnphns
Se possível, você pode explicar em termos leigos o que significa um PC não rotacionado?
Sai_636
@ sai_636 Para termos leigos, consulte stats.stackexchange.com/questions/2691 .
Ameba diz Reinstate Monica