Como comparar a força de duas correlações de Pearson?

10

Foi-me perguntado por um revisor se as correlações de Pearson (valores-r) apresentadas em uma tabela podem ser comparadas entre si, de modo que se possa afirmar que uma é "mais forte" que a outra (além de apenas observar os valores-reais) .

Como você faria isso? Eu encontrei esse método

http://vassarstats.net/rdiff.html

mas não tenho certeza se isso se aplica.

pecorino
fonte
2
Suas duas correlações são calculadas a partir da mesma amostra de observações?
Dimitriy V. Masterov
Algo como um intervalo de confiança para a diferença poderia funcionar. Você pode usar a simulação sob alguma premissa distributiva ou aproximações normais assintóticas. Em amostras grandes, você pode usar a inicialização.
Glen_b -Reinstate Monica
O AFAIK deriva o IC dos escores z e da transformação reversa de z em r para um IC em rs funciona. Mesmo para um IC de autoinicialização, pode ser apropriado primeiro transformá-los.
Jona

Respostas:

22

(Presumo que você esteja falando sobre os r obtidos de uma amostra.)

O teste nesse site se aplica no sentido de tratar r como qualquer parâmetro cujo valor pode diferir entre duas populações. Como r é diferente de qualquer outra medida, como a média, que você confia muito em comparar, usando o teste t ? Bem, é diferente porque está vinculado entre -1,1, não possui a distribuição adequada, então você precisa Fisher transformá- lo antes de fazer inferência (e depois transformá-lo depois, se você quiser, por exemplo, obter um IC). As pontuações z resultantes do teste têm a forma adequada para fazer inferência. É para isso que o teste ao qual você está vinculando está fazendo.

Portanto, o que você vincula é um procedimento para inferir o que poderia acontecer se você pudesse obter r para a totalidade da (s) população (s) da qual você está amostrando - o r para um grupo seria maior que para o outro ou eles são precisamente os mesmos? Vamos chamar essa hipótese posterior de H . Se o teste retornar um valor p baixo , isso implica que, com base na sua amostra, você deve ter pouca confiança na hipótese de que o valor verdadeiro da diferença entre os dois rs seria exatamente 0 (pois esses dados ocorreriam raramente se a diferença em r era exatamente 0). Caso contrário, você não tem os dados para rejeitar, com confiança, essa hipótese de precisão igual.0r , porque é verdade e / ou porque sua amostra é insuficiente. Note que eu poderia ter feito a mesma história sobre a diferença de médias (usando o teste t ) ou qualquer outra medida.

Uma questão completamente diferente é se a diferença entre os dois seria significativa . Infelizmente, não há uma resposta direta a isso e nenhum teste estatístico pode lhe dar a resposta. Talvez o valor verdadeiro (o valor da população, e não o que você observa) de r seja 0,5 em um e 0,47 no outro grupo. Neste caso, a hipótese estatística de sua equivalência (o nosso H ) seria falsa. Mas isso é uma diferença significativa ? Depende - algo da ordem de 3% mais variação explicada é significativo ou sem sentido? Cohen deu diretrizes grosseiras para interpretar r (e presumivelmente, diferenças entre r0 0), mas o fizeram apenas sob o conselho de que não passam de um ponto de partida. E você nem sabe a diferença exata, mesmo que faça alguma inferência, por exemplo, calculando o IC para as diferenças entre as duas correlações. Muito provavelmente, uma variedade de possíveis diferenças será compatível com seus dados.

Uma aposta comparativamente segura seria calcular os intervalos de confiança para seus r e, possivelmente, o IC para a diferença deles, e deixar o leitor decidir.

jona
fonte
4
Não sei se você é professora, mas deveria. Isso é fácil de entender, mesmo para alguém com conhecimento básico de estatística, graças à sua ótima explicação.
ataque aéreo