Comparando coeficientes de correlação

11

Eu tenho dois conjuntos de dados em que tenho valores ~ 250.000 para amostras de 78 e 35. Algumas das amostras são membros de uma família e isso pode afetar os dados. Eu calculei a correlação pareada e ela varia entre 0,7 e 0,95, mas gostaria de saber se há diferença significativa nos coeficientes de correlação intra vs inter-família? Qual é a melhor maneira de fazer isso? obrigado

biomédico
fonte

Respostas:

6

Uma maneira geral de comparar dois coeficientes de correlação é usar o método de transformação z de Fisher, que diz que é aproximadamente normal com média e desvio padrão . Se as amostras forem independentes, você transformará cada coeficiente de correlação e a diferença entre as duas correlações transformadas será normal com a média e desvio padrão . A partir disso, você pode formar uma estatística e fazer testes como faria em um teste comum de duas amostras .ρ^1 1,ρ^2umarctumanh(ρ^)umarctumanh(ρ)1 1/n-3umarctumanh(ρ1 1)-umarctumanh(ρ2)1 1/(n1 1-3)+1 1/(n2-3)zz

Macro
fonte
2

Embora a resposta do @ Macro seja boa, ela exige uma suposição sobre a (in) dependência das estatísticas. Outra abordagem seria usar a inicialização. A idéia seria manter uma variável fixa e embaralhar a outra variável, calcular a correlação para cada uma de suas amostras e fazer a diferença. Repita várias vezes para obter uma distribuição e use essa distribuição para testar a hipótese de que as correlações são as mesmas. A estrutura do seu conjunto de dados não é tão clara para mim, por isso é difícil fornecer mais detalhes.

Charlie
fonte