Quais métodos de correlação robustos são realmente usados?

18

Planejo fazer um estudo de simulação em que comparo o desempenho de várias técnicas de correlação robustas com diferentes distribuições (distorcidas, com outliers, etc.). Com robusto , quero dizer o caso ideal de ser robusto contra a) distribuições distorcidas, b) discrepantes ec) caudas pesadas.

Junto com a correlação de Pearson como linha de base, eu estava pensando em incluir as seguintes medidas mais robustas:

  • Ρ de Spearmanρ
  • Correlação de curvatura percentual (Wilcox, 1994, [1])
  • Elipsóide de volume mínimo, determinante de covariância mínimo ( cov.mve/ cov.mcdcom a cor=TRUEopção)
  • Provavelmente, a correlação winorized

É claro que existem muitas outras opções (especialmente se você incluir também técnicas de regressão robustas), mas quero me restringir às abordagens mais usadas / promissoras.

Agora eu tenho três perguntas (fique à vontade para responder apenas uma):

  1. Existem outros métodos correlacionais robustos que eu poderia / deveria incluir?
  2. Quais técnicas de correlação robustas são realmente usadas em seu campo? (Falando em pesquisa psicológica: exceto de Spearman , nunca vi nenhuma técnica de correlação robusta fora de um artigo técnico. O bootstrapping está se tornando cada vez mais popular, mas outras estatísticas robustas são mais ou menos inexistentes até agora).ρ
  3. Já existem comparações sistemáticas de várias técnicas de correlação que você conhece?

Também fique à vontade para comentar a lista de métodos dada acima.


[1] Wilcox, RR (1994). O coeficiente de correlação da dobra percentual. Psychometrika , 59, 601-616.

Felix S
fonte

Respostas:

3

Vindo de uma perspectiva psicológica, a correlação de Pearson e Spearman parece ser a mais comum. No entanto, acho que muitos pesquisadores em psicologia se envolvem em vários procedimentos de manipulação de dados em variáveis ​​constituintes antes de realizar a correlação de Pearson. Imagino que qualquer exame de robustez deva considerar os efeitos de:

  • transformações de uma ou ambas as variáveis ​​para fazer com que as variáveis ​​se aproximem de uma distribuição normal
  • ajuste ou exclusão de valores discrepantes com base em uma regra estatística ou conhecimento de problemas com uma observação
Jeromy Anglim
fonte
1

Eu recomendaria este excelente artigo publicado na Science em 2011, que eu publiquei aqui anteriormente . Há a proposta de uma nova medida robusta, juntamente com uma comparação exaustiva e excelente com outras. Além disso, todas as medidas são testadas quanto à robustez. Observe que essa nova medida também é capaz de identificar mais de uma relação funcional nos dados e também de identificar relações não funcionais.

Miroslav Sabo
fonte
Ótimo! Vou dar uma olhada muito de perto nisso. Parece muito promissor ...
Felix S
1
Você pode colocar o nome do artigo, por favor? Parece ter desaparecido!
Creatron
2
Detectando Associações romance em grandes conjuntos de dados
Miroslav Sabo
6
Esse artigo recebeu muitas críticas. Parece ser exagerado. Muita e muita mídia e relações públicas funcionam, mas parece falhar mal em exemplos triviais como ▄▀ que ele reconhece como "linear". O estudo do IIRC também não foi justo, pois eles usavam fileiras para seu próprio método; mas comparado a Pearson em vez da correlação de Spearman.
Anony-Mousse -Reinstala Monica
8
Especificamente, consulte refutações dessa abordagem em: statweb.stanford.edu/~tibs/reshef/comment.pdf , ie.technion.ac.il/~gorfinm/files/science6.pdf , arxiv.org/abs/1301.7745v1
metaperture 20/08
1

O tau de Kendall é amplamente utilizado na teoria das cópulas, provavelmente porque é algo muito natural a considerar nas cópulas arquimedianas. As parcelas do tau acumulado de Kendall foram introduzidas por Genest e Rivest como uma maneira de escolher um modelo entre famílias de cópulas bivariadas.

Link para o artigo de Genest Rivest (1993)

Solha
fonte
1

Algumas medidas robustas de correlação são:

  1. Coeficiente de correlação de classificação de Spearman

  2. Coeficiente de correlação Signum (Blomqvist)

  3. Kendall's Tau

  4. Coeficiente de Correlação Absoluta de Bradley

  5. Coeficiente de correlação Shevlyakov

Referências:

• Blomqvist, N. (1950) "Em uma medida de dependência entre duas variáveis ​​aleatórias", Annals of Mathematics Statistics, 21 (4): 593-600. Bradley, C. (1985) "The Absolute Correlation", The Mathematical Gazette, 69 (447): 12-17. Shevlyakov, GL (1997), “Estimativa robusta de um coeficiente de correlação”, Journal of Mathematics Sciences, 83 (3): 434-438. • Spearman, C. (1904) "A prova e medição da associação entre duas coisas", American Journal of Psychology, 15: 88-93.

Sudhanshu K Mishra
fonte