Teste de significância de três ou mais correlações usando a transformação de Fisher

9

Seguindo meus posts anteriores, até onde posso entender, se eu tiver três coeficientes de correlação, terei que testá-los em pares para ver se há uma diferença significativa entre eles.

Isso significa que eu precisaria usar a transformação Fishers para calcular a pontuação z de re, em seguida, o valor de p de z (que as calculadoras recomendadas nos posts anteriores fazem, felizmente) e depois verificar se o valor de p é maior ou menor que meu valor alfa (0,05) para cada par.

ou seja, se 21 a 30 anos for a faixa etária 1, 31 a 40 anos for a faixa etária 2 e 41 a 50 anos for a faixa etária 2, minha comparação das correlações entre seus hábitos de compra e perda de peso seria:

  • Grupo 1 vs. Grupo 2
  • Grupo 1 vs. Grupo 3
  • Grupo 2 vs. Grupo 3

Em vez de fazer três cálculos separados, existe uma maneira de fazer todos esses cálculos em uma única etapa?

Adhesh Josh
fonte
11
Você poderia ser um pouco mais detalhado? Como em - qual é a sua resposta, suas variáveis ​​explicativas e em quais correlações você está interessado? Você pode não transformar de Fisher para testar a correlação; um simples teste t pode ser suficiente.
suncoolsu
@suncoolsu Estou testando a correlação entre hábitos de compra e ganho de peso para esses três grupos. Meus resultados são os seguintes: Grupo 1: r = 0,8978, n = 105; Grupo 2: r = 0,55678, n = 95; e Grupo 3: r = 0,7865, n = 120.
Adhesh Josh
Eu acho que seus dados passam a IOTT. Esse é o teste de trauma interocular - ele atinge você entre os olhos. Se as correlações de .9, .6 e .8 não são diferentes entre si, o que é? Mas se você estiver realmente interessado
Peter Flom - Reinstate Monica

Respostas:

4

Sua pergunta é um exemplo perfeito de modelos de regressão com preditores quantitativos e qualitativos . Especificamente, os três grupos etários - - são as variáveis ​​qualitativas e as variáveis ​​quantitativas sãohábitos de compraeperda de peso(acho que sim, porque você está calculando correlações).1,2,&3

Devo enfatizar que essa é uma maneira muito melhor de modelar do que calcular correlações separadas por grupo, porque você tem mais dados para modelar; portanto, suas estimativas de erro (valores-p, etc.) serão mais confiáveis. Uma razão mais técnica é o maior grau de liberdade resultante na estatística do teste t para testar a significância dos coeficientes de regressão.

Operando pela regra de que preditores qualitativos podem ser manipulados por variáveis ​​indicadoras c - 1 , apenas duas variáveis ​​indicadoras, X 1 , X 2 , são necessárias aqui, definidas da seguinte forma:cc1 1X1 1,X2

X 2 = 1  se a pessoa pertencer ao grupo 2 ; 0  caso contrário .

X1 1=1 1 se a pessoa pertencer ao grupo 1;0 0 de outra forma.
X2=1 1 se a pessoa pertencer ao grupo 2;0 0 de outra forma.

Isso implica que o grupo é representado por X 1 = 0 , X 2 = 0 ; representar a sua resposta - compras hábito como Y e quantitativa da perda de peso variável explicativa como W . Agora você se encaixa neste modelo linear3X1 1=0 0,X2=0 0YW

A pergunta óbvia é que importa se alteramos W e Y (porque escolhi aleatoriamente os hábitos de compra como variável de resposta). A resposta é sim - as estimativas dos coeficientes de regressão mudarão, mas o teste de "associação" entre condicionados em grupos (aqui teste t, mas é o mesmo que testar a correlação para uma única variável preditora) não mudança. Especificamente,

E[Y]=β0 0+β1 1X1 1+β2X2+β3W.
WY

E [ Y ] = ( β 0 + β 2 ) + β 3 W  - para o segundo grupo , E [ Y ] = ( β 0 + β 1 ) + β 3 W  - para o primeiro grupo , é equivalente a ter 3 linhas separadas, dependendo dos grupos, se você desenhar Y

E[Y]=β0 0+β3W - para o terceiro grupo,
E[Y]=(β0 0+β2)+β3W - para o segundo grupo,
E[Y]=(β0 0+β1 1)+β3W - para o primeiro grupo,
Yvs . Essa é uma boa maneira de visualizar o que você está testando faz sentido (basicamente uma forma de EDA e verificação de modelo, mas você precisa distinguir adequadamente as observações agrupadas). Três linhas paralelas indicam nenhuma interação entre os três grupos e W , e muita interação implica que essas linhas se cruzarão.WW

Como fazem os testes que você pergunta. Basicamente, depois de ajustar o modelo e obter as estimativas, você precisa testar alguns contrastes. Especificamente para suas comparações:

Grupo 2 x Grupo 3: β2+β0 0-β0 0=0 0,
Grupo 1 vs Grupo 3: β1 1+β0 0-β0 0=0 0,
Grupo 2 x Grupo 1: β2+β0 0-(β0 0+β1 1)=0
suncoolsu
fonte
Testar a equivalência de inclinações é diferente de testar a equivalência de correlações. Veja, por exemplo: jessicagrahn.com/uploads/6/0/8/5/6085172/comparecorrcoeff.doc
Wolfgang
t=ρn-21 1-ρ2tn-2
Além disso, seu documento fala sobre a comparação de diferentes populações, o que não é o caso de um único preditor.
suncoolsu
H0:β1=β2=β3H0 0:ρ1 1=ρ2=ρ3β
Sim, você está certo (como eu disse antes), mas minha resposta pressupõe que o OP estava interessado em determinar a relação entre perda de peso e hábitos de compra com base em grupos (não necessariamente correlação). Acho que estava errado porque o OP aceitou a outra resposta. No entanto, essa resposta serve como uma alternativa útil (espero).
suncoolsu 5/09/11
1

O teste em pares nesta situação não é (ainda) justificado pela descrição dos dados. Você deve usar métodos de regressão multivariáveis. Uma chamada R pode ser:

lm( weight_end ~ shop_habit + age_grp + weight_begin)

Construir 3 categorias não é o melhor método para controlar a idade (ou analisar sua contribuição, se essa for a questão principal), pois a categorização pode distorcer os relacionamentos contínuos, e os termos das splines removem a necessidade de escolher pontos de divisão arbitrários. Uma vez que exista evidência suficiente de uma associação de alteração de peso após uma análise adequada, haverá opções de teste ad-hoc que podem ser implementadas.

(Eu concordei com a maior parte do que @whuber expressou em um comentário, e geralmente considero seu comentário autoritário, mas não entendo sua posição em relação às abordagens de regressão.)

DWin
fonte