Como as correlações gama Goodman-Kruskal e Kendall tau ou Spearman rho se comparam?

31

No meu trabalho, estamos comparando classificações previstas versus classificações verdadeiras para alguns conjuntos de dados. Até recentemente, usamos o Kendall-Tau sozinho. Um grupo que trabalha em um projeto semelhante sugeriu que tentássemos usar a gama Goodman-Kruskal e que eles preferissem. Eu queria saber quais eram as diferenças entre os diferentes algoritmos de correlação de classificação.

O melhor que encontrei foi essa resposta , que afirma que Spearman é usado no lugar de correlações lineares usuais e que Kendall-Tau é menos direto e se parece mais com Goodman-Kruskal Gamma. Os dados com os quais estou trabalhando não parecem ter correlações lineares óbvias, e os dados são fortemente distorcidos e fora do normal.

Além disso, Spearman geralmente relata uma correlação mais alta que Kendall-Tau para nossos dados, e eu queria saber o que isso diz sobre os dados especificamente. Eu não sou estatístico, então alguns dos jornais que estou lendo sobre essas coisas me parecem um jargão, desculpe.

Poik
fonte
3
" Spearman geralmente relata melhor correlação do que Kendall-Tau para nossos dados, e eu queria saber o que isso diz sobre os dados especificamente " ... provavelmente nada; Kendall geralmente é mais próximo de 0 que Spearman quando as correlações não são realmente próximas de ou - mede a associação de maneira diferente; o fato de ser tipicamente menor em magnitude não significa que a correlação de Spearman seja 'melhor'; eles estão apenas medindo coisas diferentes sobre os dados. O que o levaria a dizer 'melhor correlação'? ρ 0 ± 1τρ0±1
Glen_b -Reinstate Monica
1
Isso foi indiretamente o mesmo que minha pergunta, @Glen_b; exceto, eu estava perguntando por que os algoritmos relataram maior correlação e o que causaria isso. Vou mudar "melhor" para "mais alto", para deixar meu significado um pouco mais claro. Você está certo que eles medem coisas diferentes e que os números realmente não têm muito a ver um com o outro, mas eu queria saber o que os números realmente significavam, o que é respondido em detalhes abaixo.
Poik

Respostas:

29

Spearman rho vs Kendall tau . Esses dois são tão diferentes computacionalmente que você não pode comparar diretamente suas magnitudes. Spearman geralmente é maior em 1/4 a 1/3 e isso leva a concluir incorretamente que Spearman é "melhor" para um determinado conjunto de dados. A diferença entre rho e tau está em sua ideologia, proporção de variância para rho e probabilidade para tau. Rho é um Pearson r usual aplicado para dados classificados e, como r, é mais sensível a pontos com grandes momentos (ou seja, desvios do centro da nuvem) do que a pontos com pequenos momentos. Portanto, rho é bastante sensível à forma da nuvem após a classificaçãofeito: o coeficiente para uma nuvem rômbica oblonga será maior que o coeficiente para uma nuvem oblonga com halteres (porque as arestas agudas da primeira são grandes momentos). Tau é uma extensão do Gamma e é igualmente sensível a todos os pontos de dados , por isso é menos sensível a peculiaridades na forma da nuvem classificada. Tau é mais "geral" que rho, pois rho é garantido apenas quando você acredita que a relação subjacente (modelo ou funcional na população) entre as variáveis ​​é estritamente monotônica. Enquanto o Tau permite a curva subjacente não monotônica e mede qual "tendência" monotônica, positiva ou negativa, prevalece no geral. Rho é comparável a r em magnitude; tau não é.

Kendall tau como Gamma . Tau é apenas uma forma padronizada de gama. Várias medidas relacionadas têm numerador mas diferem no denominador de normalização :PQ

  • Gama: P+Q
  • D de Somers ("x dependente"): P+Q+Tx
  • D de Somers ("y dependente"): P+Q+Ty
  • Somers 'D ("simétrico"): média aritmética dos dois acima
  • Tau-b corr de Kendall. (mais adequado para mesas quadradas): média geométrica dessas duas
  • Tau-c corr de Kendall (mais adequado para mesas retangulares): N2(k1)/(2k)
  • Tau-a corr de Kendall. (não faz ajuste para laços): N(N1)/2=P+Q+Tx+Ty+Txy

onde - número de pares de observações com "concordância", Q - com "inversão"; T x - número de ligações pela variável X, T y - pela variável Y, T x y - pelas duas variáveis; N - número de observações, k - número de valores distintos nessa variável em que esse número é menor.PQTxTyTxyNk

Assim, tau é diretamente comparável em teoria e magnitude com Gamma. Rho é diretamente comparável em teoria e magnitude com Pearson . A boa resposta de Nick Stauner aqui diz como é possível comparar rho e tau indiretamente.r

Veja também sobre tau e rho.

ttnphns
fonte
14

Aqui está uma citação de Andrew Gilpin (1993) defendendo o Maurice Kendall sobre o de Spearman por razões teóricas:ρτρ

[ de Kendall ] se aproxima de uma distribuição normal mais rapidamente que , pois , o tamanho da amostra, aumenta; e também é mais tratável matematicamente, principalmente quando há laços. ρ N ττρNτ

Não posso acrescentar muito sobre Goodman-Kruskal , exceto que ele parece produzir estimativas um pouco maiores que o de Kendall em uma amostra de dados de pesquisas com os quais tenho trabalhado ultimamente ... e, claro, notavelmente estimativas mais baixas do que de Spearman . No entanto, também tentei calcular algumas estimativas parciais (Foraita & Sobotka, 2012), e essas foram mais próximas da parcial do que da parcial ... Porém, demorou bastante tempo de processamento, então vou deixar os testes de simulação ou comparações matemáticas com outra pessoa ... (quem saberia fazê-las ...)τ ρ γ ρ τγτργρτ

Como ttnphns implica, você não pode concluir que suas estimativas de são melhores do que suas estimativas de pela magnitude, porque suas escalas diferem (mesmo que os limites não). Gilpin cita Kendall (1962) como descrevendo a razão de para como aproximadamente 1,5 na maior parte da faixa de valores. Eles se aproximam gradualmente à medida que suas magnitudes aumentam, de modo que ambos se aproximam de 1 (ou -1), a diferença se torna infinitesimal. Gilpin dá um agradável grande tabela de valores equivalentes de , , , d , e para fora para o terceiro dígito paraτ ρ τ ρ r r 2 Z r τ rρτρτρrr2Zrτa cada incremento de 0,01 em seu intervalo, exatamente como você esperaria ver na capa de um livro de estatísticas de introdução. Ele baseou esses valores nas fórmulas específicas de Kendall, que são as seguintes: (simplifiquei esta fórmula para do forma em que Gilpin escreveu, em termos do de Pearson .)ρr

r=pecado(τπ2)ρ=6π(τarcsin(pecado(τπ2)2))
ρr

Talvez faça sentido converter seu em umρτρ e ver como a mudança computacional afeta sua estimativa de tamanho de efeito. Parece que a comparação indicaria até que ponto os problemas aos quais o de Spearman é mais sensível estão presentes nos seus dados, se houver. Certamente existem métodos mais diretos para identificar cada problema específico individualmente; minha sugestão produziria um tamanho de efeito omnibus rápido e sujo para esses problemas. Se não houver diferença (após corrigir a diferença de escala), pode-se argumentar que não há necessidade de procurar mais por problemas que se aplicam apenas aρρρ. Se houver uma diferença substancial, provavelmente é hora de quebrar a lente de aumento para determinar o que é responsável.

Não sei ao certo como as pessoas costumam relatar tamanhos de efeito ao usar o de Kendall (na medida em que infelizmente as pessoas se preocupam em relatar tamanhos de efeito em geral), mas como parece provável que leitores desconhecidos tentariam interpretá-lo na escala de Pearson. , pode ser aconselhável relatar sua estatística e seu tamanho de efeito na escala de usando a fórmula de conversão acima ... ou pelo menos apontar a diferença de escala e dar um grito a Gilpin por sua útil tabela de conversão . r τ rτrτr

Referências

Foraita, R. & Sobotka, F. (2012). Validação de modelos gráficos. Pacote gmvalid, v1.23. A rede abrangente de arquivamento R. URL: http://cran.r-project.org/web/packages/gmvalid/gmvalid.pdf

Gilpin, AR (1993). Tabela para conversão de Tau de Kendall em Rho de Spearman no contexto de medidas de magnitude de efeito para metanálise. Medida educacional e psicológica, 53 (1), 87-92.

Kendall, MG (1962). Métodos de correlação de classificação (3ª ed.). Londres: Griffin.

Nick Stauner
fonte
9

ρτγγτXYγX1X2YX X γXs por ser mais contínuo. Essa falta de recompensa o torna um pouco inconsistente com os testes de razão de verossimilhança com base no modelo. Um fortemente vinculado (digamos, um binário ) pode ter alto .XXγ

Frank Harrell
fonte
2
Frank, você pode explicar Spearman's ρ is related to the probability of majority concordance among random triplets of observationsem mais detalhes, não muito matematicamente difícil, se possível? Obrigado.
precisa saber é o seguinte
1
Eu li isso há muitos anos, provavelmente em um texto estatístico não paramétrico. Não consegui encontrar a referência.
precisa
1
Lamentável ... :-( Porque a própria declaração é muito intrigante.
ttnphns