Sobre o uso de rotação oblíqua após PCA

9

Vários pacotes estatísticos, como SAS, SPSS e R, permitem executar algum tipo de rotação de fator após um PCA.

  1. Por que uma rotação é necessária após um PCA?
  2. Por que você aplicaria uma rotação oblíqua após uma APC, uma vez que o objetivo da APC é produzir dimensões ortogonais?
pbneau
fonte
Fiz uma pergunta que ilustra a necessidade de rotação de fatores após o PCA, já que o PCA fornece o resultado tendencioso. Veja stats.stackexchange.com/questions/6575/…
mbaitoff

Respostas:

8

Eu acho que existem opiniões ou pontos de vista diferentes sobre o PCA, mas basicamente o consideramos uma técnica de redução (você reduz o espaço dos recursos para um menor, geralmente muito mais "legível", desde que você cuide da centralização / padronização adequada do dados quando necessário) ou uma maneira de construir fatores latentesou dimensões que representam uma parte significativa da dispersão interindividual (aqui, os "indivíduos" representam as unidades estatísticas nas quais os dados são coletados; pode ser país, pessoas etc.). Nos dois casos, construímos combinações lineares das variáveis ​​originais que respondem pelo máximo de variação (quando projetadas no eixo principal), sujeitas a uma restrição de ortogonalidade entre quaisquer dois componentes principais. Agora, o que foi descrito é puramente algebrico ou matemático e não o consideramos um modelo (gerador), ao contrário do que é feito na tradição da análise fatorial, em que incluímos um termo de erro para explicar algum tipo de erro de medição . Também gosto da introdução de William Revelle em seu próximo manual sobre psicometria aplicada usando R (Capítulo 6), se quisermos analisar a estrutura de uma matriz de correlação,

A primeira [abordagem, PCA] é um modelo que aproxima a matriz de correlação em termos do produto dos componentes em que cada componente é uma soma linear ponderada das variáveis, o segundo modelo [análise fatorial] também é uma aproximação da matriz de correlação por o produto de dois fatores, mas os fatores nisto são vistos como causas e não como conseqüências das variáveis.

Em outras palavras, com o PCA, você está expressando cada componente (fator) como uma combinação linear das variáveis, enquanto na FA essas são as variáveis ​​que são expressas como uma combinação linear dos fatores. É bem sabido que ambos os métodos geralmente produzem resultados bastante semelhantes (ver, por exemplo, Harman, 1976 ou Catell, 1978), especialmente no caso "ideal", onde temos um grande número de indivíduos e um bom fator de proporção: variáveis ​​(tipicamente variando entre 2 e 10, dependendo dos autores que você considerar!). Isso ocorre porque, ao estimar as diagonais na matriz de correlação (como é feito em FA, e esses elementos são conhecidos como comunalidades), a variação de erro é eliminada da matriz de fatores. Esta é a razão pela qual o PCA é frequentemente usado como uma maneira de descobrir fatores latentes ou construções psicológicas no lugar da FA desenvolvida no século passado. Mas, à medida que avançamos, muitas vezes queremos alcançar uma interpretação mais fácil da estrutura fatorial resultante (ou da chamada matriz de padrões). E então vem o truque útil de girar o eixo fatorial, para maximizar a carga de variáveis ​​em um fator específico ou alcançar, de forma equivalente, uma "estrutura simples". Usando rotação ortogonal (por exemplo, VARIMAX), preservamos a independência dos fatores. Com a rotação oblíqua (por exemplo, OBLIMIN, PROMAX), nós a quebramos e fatores podem se correlacionar. Isso tem sido amplamente debatido na literatura e liderado alguns autores (não psicometristas, mas estatísticos no início dos anos 1960 '

Mas o ponto é que os métodos de rotação foram originalmente desenvolvidos no contexto da abordagem de FA e agora são usados ​​rotineiramente com o PCA. Não acho que isso contradiga a computação algorítmica dos componentes principais: você pode girar seus eixos fatoriais da maneira que quiser, desde que tenha em mente que, uma vez correlacionada (por rotação oblíqua), a interpretação do espaço fatorial se torna menos óbvia.

O PCA é usado rotineiramente no desenvolvimento de novos questionários, embora a FA seja provavelmente uma abordagem melhor neste caso, porque estamos tentando extrair fatores significativos que levam em consideração erros de medição e cujas relações podem ser estudadas por si mesmas (por exemplo, fatorando o padrão resultante) matriz, obtemos um modelo de fator de segunda ordem). Mas o PCA também é usado para verificar a estrutura fatorial dos já validados. Pesquisadores realmente não importam sobre FA vs. PCA quando têm, dizem 500 indivíduos representativos que são solicitados a classificar um questionário de 60 itens que aborda cinco dimensões (este é o caso do NEO-FFI, por exemplo), e acho que eles estão certos porque, neste caso, não estamos muito interessados ​​em identificar um modelo gerador ou conceitual (o termo "representante" é usado aqui para aliviar a questão da invariância da medição ).

Agora, sobre a escolha do método de rotação e por que alguns autores argumentam contra o uso estrito da rotação ortogonal, eu gostaria de citar Paul Kline, como fiz em resposta à seguinte pergunta, FA: Matriz de escolha da rotação, baseada em “Estrutura Simples Critérios " ,

(...) no mundo real, não é irracional pensar que fatores, como importantes determinantes do comportamento, estariam correlacionados. - P. Kline, Inteligência. The Psychometric View , 1991, p. 19

Concluo, assim, que, dependendo do objetivo do seu estudo (você deseja destacar os principais padrões da sua matriz de correlação ou procura fornecer uma interpretação sensata dos mecanismos subjacentes que podem ter causado a observação dessa matriz de correlação ), você pode escolher o método mais apropriado: isso não tem a ver com a construção de combinações lineares, mas apenas com a maneira como você deseja interpretar o espaço fatorial resultante.

Referências

  1. Harman, HH (1976). Análise fatorial moderna . Chicago, University of Chicago Press.
  2. Cattell, RB (1978). O uso científico da análise fatorial . Nova York, Plenum.
  3. Kline, P. (1991). Inteligência. A visão psicométrica . Routledge.
chl
fonte
4

O problema com as dimensões ortogonais é que os componentes podem ser incompreensíveis. Assim, enquanto a rotação oblíqua (ou seja, dimensões não-ortogonais) é tecnicamente menos satisfatória, essa rotação às vezes melhora a interpretabilidade dos componentes resultantes.


fonte
4

Pontos Básicos

  • A rotação pode tornar a interpretação dos componentes mais clara
  • A rotação oblíqua geralmente faz mais sentido teórico. Ou seja, as variáveis ​​observadas podem ser explicadas em termos de um número menor de componentes correlacionados.

Exemplo

  • 10 testa toda a capacidade de medição com alguma capacidade verbal e outra espacial. Todos os testes são correlacionados, mas as intercorrelações nos testes verbais ou espaciais são maiores do que no tipo de teste. Um PCA parcimonioso pode envolver dois componentes correlacionados, um verbal e um espacial. Teoria e pesquisa sugerem que essas duas habilidades estão correlacionadas. Assim, uma rotação oblíqua faz sentido teórico.
Jeromy Anglim
fonte