Teste de significância na diferença do coeficiente de correlação de Spearman

13

(Muito obrigado pelas respostas rápidas! Fiz um péssimo trabalho ao fazer a pergunta, então deixe-me tentar novamente.)

Não sei como descobrir se a diferença entre as duas correlações de Spearman é estatisticamente significativa. Eu gostaria de saber como descobrir.

A razão pela qual eu queria descobrir é que, no seguinte artigo: Interpretação semântica da Wikipedia para processamento de linguagem natural , por Gabrilovich e Markovitch ( Journal of Artificial Intelligence Research 34 (2009) 443-498).

Na Tabela 2 (p. 457), os autores estão mostrando que seu método (ESA-Wikipedia) alcança uma correlação de Spearman mais alta e estatisticamente significativa do que outros métodos, e eu gostaria de fazer o mesmo para mostrar que meu método é melhor que o anterior métodos para algum problema.

Não sei como eles calcularam a significância estatística e gostaria de saber. O autor do artigo afirmou que a correlação de classificação de Spearman foi tratada como correlação de Pearson. Não tenho certeza se esse é o caminho certo para fazê-lo. Tenho duas correlações de Spearman e gostaria de saber se a diferença entre elas é estatisticamente significativa ou não.

Estou ciente de que sites, como http://faculty.vassar.edu/lowry/rdiff.html , fornecem calculadora on-line para obter a diferença entre duas correlações de Pearson. Não consigo encontrar uma calculadora on-line semelhante para a diferença entre as duas correlações de Spearman.

Uma solução a partir do link fornecido por Peter Flom

NOTA: Os procedimentos suportam apenas as correlações de Spearman abaixo de 0,6.

  1. Deixe- = a Fisher transformar da correlação observada do conjunto A , Z B = a Fisher transformar da correlação observada do conjunto B .zAAzBB

  2. Para , deixe Y A i = n z A - ( n - 1 ) z A i , onde z A i é a transformação de Fisher do conjunto A da correlação de um lado esquerdo obtida por excluir ( x i , y i ) , reclassificar e recalcular a correlação. (Cada z A i é baseado em n -i=1,,nyAi=nzA(n1)zAizAiA(xi,yi)zAi pares; cada eliminação é temporário, por que eu só, não é permanente.) Repita para set B .n1B

  3. é a jackknifed Fisher transformar. Repita o procedimento para setB.y¯A=yAi/nB

  4. é a variância de ˉ y Uma . Repita o procedimento para set B .vy¯A=(yAiy¯A)2/(n(n1))y¯AB

  5. Use um heteroscedástico (Welch-Satterthwaite) -teste para comparar as duas estimativas jackknifed:t

ondenAenBsão o número de amostras do conjuntoAeB,respectivamente.

t=y¯Ay¯Bvy¯A+vy¯B,df=(vy¯A+vy¯B)2vy¯A2nA1+vy¯B2nB1
nAnBAB

Antes da primeira edição

Eu tenho um conjunto de classificações com classificação humana (HUMAN-RANKING), um conjunto de classificações gerado pelo método popular atualmente usado (PRESENT-RANKING) e, finalmente, um conjunto de classificações gerado pelo meu método proposto (MY-RANKING) .

Calculei a correlação de Spearman entre HUMAN-RANKING e PRESENT-RANKING. Deixe-me chamar assim: HUMAN-PRESENT-SPEARMAN.

Descobri então a correlação de Spearman entre HAN-RANKING e MY-RANKING. Deixe-me chamar assim: HUMAN-MY-SPEARMAN.

Como posso descobrir se a diferença entre HUMAN-MY-SPEARMAN e HUMAN-PRESENT-SPEARMAN é estatisticamente significativa?

Patrick Chan
fonte
2
Bem-vindo Patrick. Estou lutando com o mesmo problema, mas com Pearson r. Se você verificar minhas entradas, terá uma ideia do que pode fazer.
Adhesh Josh
Embora você possa ter dificuldade em enquadrar essa questão em termos estatísticos - seria útil se soubéssemos exatamente em que você estava interessado. Você está interessado na proximidade da correlação (com que precisão as pontuações se prevêem) ou na existência de um relacionamento mais que acaso. Dado que você parece ter classificado os dados, repetidos no tempo, pode ser útil ler alguns coeficientes de correlação intra-classe. Espero ter esse direito, a questão não está completamente clara.
Página
Obrigado Adhesh e Rosser. Sinto muito pela minha má descrição da minha pergunta. Eu reescrevi. Espero que tenha se tornado uma pergunta compreensível.
Patrick Chan
Oi! Atualmente, estou lutando com o mesmo problema. Por acaso, você tem um código pronto que implementa sua sugestão? Além disso, por que funciona apenas para valores de correlação abaixo de 0,6?
Fsociety 14/10

Respostas:

1

O artigo que você cita explica o método nos seguintes termos:

[...] mostramos a significância estatística da diferença entre o desempenho da versão ESA-Wikipedia (26 de março de 2006)) e o de outros algoritmos usando a transformação z de Fisher (Press, Teukolsky, Vetterling & Flannery, Numerical Receitas em C: The Art of Scientific Computing, Cambridge University Press, 1997, Seção 14.5).

Sugiro que você siga essa referência ou consulte a página da Wikipedia no coeficiente de Spearman para obter detalhes.

Guillermo G.
fonte
1
Obrigado Guillermo. Suspeitei que eles tratassem a correlação de classificação de Spearman como correlação de Pearson e calculassem a diferença das duas correlações de Pearson. No entanto, parece-me que não é a maneira correta de fazê-lo, e estou fazendo um post aqui.
Patrick Chan
Você conhece alguma implementação em funcionamento (de preferência on-line), porque é isso que o OP procura?
Chl