Por que os coeficientes de regressão em um modelo de análise fatorial são chamados de "cargas"?

7

Em deste escritas rosca @ttnphns que

Por serem coeficientes de regressão, [...] insisto que é melhor dizer "fator de carga variável" do que "fator de carga variável".

Aprendi aqui que um modelo de análise fatorial é o sistema de equações

V1=a1IFI+a1IIFII+E1

V2=a2IFI+a2IIFII+E2

...

Vp=

onde o coeficiente a é uma carga, F é um fator [...] e a variável E são resíduos de regressão.

No entanto, não entendi como devemos dizer "fator carrega variável" em vez de vice-versa. O que é o termo "carregamento" que o faz seguir?

Também não sei por que precisamos do termo "carregamento", quando já tínhamos o termo "coeficiente de regressão". É porque às vezes os coeficientes de regressão também são coeficientes de correlação e os estatísticos queriam um termo genérico para cobrir ambos os casos?

Espero que a resposta a esta pergunta facilite aos alunos que lembrem que os fatores carregam as variáveis ​​observadas, e não o contrário.

user1205901 - Restabelecer Monica
fonte
11
Nunca me lembro o que deveria "carregar" (ou carregar? Ou ser carregado por? Etc.) o quê e, portanto, evito usar o verbo "carregar" nesse contexto. Eu digo "cargas" embora. No entanto, observe que a FA não é uma regressão e não há "coeficientes de regressão" aqui, pelo menos não no sentido usual da palavra. Eu acho que seria confuso chamar coeficientes de regressão. Ou não chame nada, ou chame "loadings". Mas eles não são coeficientes de regressão! A
Ameba
@amoeba, dizendo que FA is not a regressionvocê está correto e não está correto. A FA como procedimento de extração obviamente não é um procedimento de regressão. Mas o modelo de FA é um modelo regressivo. Se pudéssemos conhecer os valores verdadeiros de Fs (em vez de pontuações aproximadas) e o ajuste fosse excelente (reprodução incorreta de correlações pelas cargas), e decidirmos regredir os Vs pelos valores dessas Fs, as cargas sairão como nosso estimativas de parâmetros.
ttnphns

Respostas:

5

Não entendi como devemos dizer "fator carrega variável" em vez de vice-versa

Explicação abstrata . Se um ponto visto como objeto tem uma coordenada em um eixo visto como recurso, então a coordenada é quanto o recurso carrega o ponto, quanto cobra, por si só, esse ponto. Se a minha altura é 1,86 m, é assim que eu sou carregado pela altura (não a quantidade de altura que é carregada por mim). Observe que o carregamento é a coordenada da variável no fator como eixo no gráfico de carregamento .

Explicação de característica latente . O fator é conceituado como uma entidade que joga "nas" variáveis ​​ou "por trás" delas e as faz correlacionadas. Portanto, "carga" é intuitivamente uma boa palavra para expressar o grau em que a variável depende fortemente, impulsionada pelo fator latente. O modelo de análise fatorial é um modelo regressivo em que os fatores explicam ou "influenciam" as variáveis ​​observadas. Qualquer coeficiente de regressão (não apenas fator analítico) pode ser rotulado como "carregamento": coeficiente de regressão = peso de regressão = carga de regressão. Mais motivo para chamar o coeficiente de fator de "carregamento" vem do fato de que, no modelo de fator, os fatores s são padronizados, cada variação de unidade, enquanto uma variávelFVnão é necessariamente padronizado. Portanto, ocorre que o efeito em é realizado / expresso completamente e somente através dos coeficientes de carga. Sempre que no modelo regressivo uma variável padronizada prediz uma variável potencialmente não padronizada - chame o coeficiente de "carregamento".V

Por que precisamos do termo "carregamento", quando já tínhamos o termo "coeficiente de regressão"

Na verdade, não precisamos. A palavra "carregamento" é simplesmente uma tradição decorrente do gosto dos psicólogos por sentido figurado (a FA começou a se desenvolver há um século entre os psicólogos). Além disso, o termo "carregamento" pode ter significado estatístico um pouco diferente em outros métodos multivariados relacionados (como análise discriminante). Em geral, algumas pessoas, em alguns casos, chamam coeficientes de regressão "loadings", enquanto outros ou em outros casos - coeficientes de correlação. Portanto, o termo é confuso. Não é um termo estatístico , em última análise.

Se você não gosta da palavra, não a use. Você também pode dizer "fator de carga variável (on)" se desejar; para mim, é simplesmente um discurso impensado, não um vício.

PS Acabei de procurar em um dicionário de inglês (inglês não é minha língua) e observei que carregar pode ter significados como (1) "carreguei o carrinho" (por uma sacola ou por mim mesmo quando embarcado); (2) "o navio carrega (para cima) muitos passageiros (nele)". Se seguir o uso da segunda palavra, seria bom dizer "a variável carrega bem o fator (em si mesma, a variável)".

ttnphns
fonte
+1. Mas não gosto de chamar carregamentos de "coeficientes de regressão". Para mim, "regressão" implica que existem variáveis ​​dependentes e independentes e o objetivo é encontrar coeficientes de regressão. Nos modelos de variáveis ​​latentes, como a FA, existe apenas um conjunto de variáveis, e o objetivo é encontrar variáveis ​​latentes. Isto não é uma regressão; a matemática e os cálculos são totalmente diferentes (geralmente é necessário algo como essa maximização de expectativas para encontrar uma solução de FA; não há necessidade de EM na regressão). Eu manteria o termo "coeficiente de regressão" para regressão.
Ameba
11
This is not a regression@amoeba, não me oponho à sua maneira de entender esses termos, embora meu caminho seja um pouco diferente do seu. Essa nossa discrepância é de menor importância. Observe que dizer "modelo regressivo (= semelhante à regressão)" não é exatamente como dizer "regressão (análise)". A FA não é uma regressão, obviamente, porque não há variáveis ​​Y externas. Ainda assim, ele modela os Xs pelos Fs de alguma forma extraídos, como se os Xs fossem esses Ys. Explicar a FA em termos de "modelo regressivo" para os alunos é um passo tranquilo.
ttnphns
Essa terminologia afeta a seguinte interpretação de cargas? A interpretação do carregamento é: 1. Quanto maior o carregamento de um PC, mais influência ele tem na formação da variável. 2. Quanto maior o carregamento de uma variável, mais influência ela tem na formação da pontuação do componente principal. 3. ambos? Se isso importa, post completo aqui .
user_anon
11
Certo, agora. 1. Correto (bem, normalmente não usamos um PC por um fator honesto ). 2. Correto, mas não direto. Veja como os coeficientes de pontuação dos componentes são calculados a partir dos loadings: stats.stackexchange.com/a/126985/3277 , e também discutindo a diferença desses coef-s dos loadings: stats.stackexchange.com/a/191332/3277
ttnphns
11
@user_anon, 3). No entanto, 1 e 2 também são válidos se você estiver falando em termos de variáveis ​​aleatórias em vez de um conjunto de dados. Geralmente, a distribuição normal não é necessária.
ttnphns