Seguindo meus posts anteriores, até onde posso entender, se eu tiver três coeficientes de correlação, terei que testá-los em pares para ver se há uma diferença significativa entre eles.
Isso significa que eu precisaria usar a transformação Fishers para calcular a pontuação z de re, em seguida, o valor de p de z (que as calculadoras recomendadas nos posts anteriores fazem, felizmente) e depois verificar se o valor de p é maior ou menor que meu valor alfa (0,05) para cada par.
ou seja, se 21 a 30 anos for a faixa etária 1, 31 a 40 anos for a faixa etária 2 e 41 a 50 anos for a faixa etária 2, minha comparação das correlações entre seus hábitos de compra e perda de peso seria:
- Grupo 1 vs. Grupo 2
- Grupo 1 vs. Grupo 3
- Grupo 2 vs. Grupo 3
Em vez de fazer três cálculos separados, existe uma maneira de fazer todos esses cálculos em uma única etapa?
fonte
Respostas:
Sua pergunta é um exemplo perfeito de modelos de regressão com preditores quantitativos e qualitativos . Especificamente, os três grupos etários - - são as variáveis qualitativas e as variáveis quantitativas sãohábitos de compraeperda de peso(acho que sim, porque você está calculando correlações).1 , 2 , &3
Devo enfatizar que essa é uma maneira muito melhor de modelar do que calcular correlações separadas por grupo, porque você tem mais dados para modelar; portanto, suas estimativas de erro (valores-p, etc.) serão mais confiáveis. Uma razão mais técnica é o maior grau de liberdade resultante na estatística do teste t para testar a significância dos coeficientes de regressão.
Operando pela regra de que preditores qualitativos podem ser manipulados por variáveis indicadoras c - 1 , apenas duas variáveis indicadoras, X 1 , X 2 , são necessárias aqui, definidas da seguinte forma:c c - 1 X1 1, X2
X 2 = 1 se a pessoa pertencer ao grupo 2 ; 0 caso contrário .
Isso implica que o grupo é representado por X 1 = 0 , X 2 = 0 ; representar a sua resposta - compras hábito como Y e quantitativa da perda de peso variável explicativa como W . Agora você se encaixa neste modelo linear3 X1 1= 0 , X2= 0 Y W
A pergunta óbvia é que importa se alteramos W e Y (porque escolhi aleatoriamente os hábitos de compra como variável de resposta). A resposta é sim - as estimativas dos coeficientes de regressão mudarão, mas o teste de "associação" entre condicionados em grupos (aqui teste t, mas é o mesmo que testar a correlação para uma única variável preditora) não mudança. Especificamente,
E [ Y ] = ( β 0 + β 2 ) + β 3 W - para o segundo grupo , E [ Y ] = ( β 0 + β 1 ) + β 3 W - para o primeiro grupo , é equivalente a ter 3 linhas separadas, dependendo dos grupos, se você desenhar Y
Como fazem os testes que você pergunta. Basicamente, depois de ajustar o modelo e obter as estimativas, você precisa testar alguns contrastes. Especificamente para suas comparações:
fonte
O teste em pares nesta situação não é (ainda) justificado pela descrição dos dados. Você deve usar métodos de regressão multivariáveis. Uma chamada R pode ser:
Construir 3 categorias não é o melhor método para controlar a idade (ou analisar sua contribuição, se essa for a questão principal), pois a categorização pode distorcer os relacionamentos contínuos, e os termos das splines removem a necessidade de escolher pontos de divisão arbitrários. Uma vez que exista evidência suficiente de uma associação de alteração de peso após uma análise adequada, haverá opções de teste ad-hoc que podem ser implementadas.
(Eu concordei com a maior parte do que @whuber expressou em um comentário, e geralmente considero seu comentário autoritário, mas não entendo sua posição em relação às abordagens de regressão.)
fonte