Planejo fazer um estudo de simulação em que comparo o desempenho de várias técnicas de correlação robustas com diferentes distribuições (distorcidas, com outliers, etc.). Com robusto , quero dizer o caso ideal de ser robusto contra a) distribuições distorcidas, b) discrepantes ec) caudas pesadas.
Junto com a correlação de Pearson como linha de base, eu estava pensando em incluir as seguintes medidas mais robustas:
- Ρ de Spearman
- Correlação de curvatura percentual (Wilcox, 1994, [1])
- Elipsóide de volume mínimo, determinante de covariância mínimo (
cov.mve
/cov.mcd
com acor=TRUE
opção) - Provavelmente, a correlação winorized
É claro que existem muitas outras opções (especialmente se você incluir também técnicas de regressão robustas), mas quero me restringir às abordagens mais usadas / promissoras.
Agora eu tenho três perguntas (fique à vontade para responder apenas uma):
- Existem outros métodos correlacionais robustos que eu poderia / deveria incluir?
- Quais técnicas de correlação robustas são realmente usadas em seu campo? (Falando em pesquisa psicológica: exceto de Spearman , nunca vi nenhuma técnica de correlação robusta fora de um artigo técnico. O bootstrapping está se tornando cada vez mais popular, mas outras estatísticas robustas são mais ou menos inexistentes até agora).
- Já existem comparações sistemáticas de várias técnicas de correlação que você conhece?
Também fique à vontade para comentar a lista de métodos dada acima.
[1] Wilcox, RR (1994). O coeficiente de correlação da dobra percentual. Psychometrika , 59, 601-616.
fonte
O tau de Kendall é amplamente utilizado na teoria das cópulas, provavelmente porque é algo muito natural a considerar nas cópulas arquimedianas. As parcelas do tau acumulado de Kendall foram introduzidas por Genest e Rivest como uma maneira de escolher um modelo entre famílias de cópulas bivariadas.
Link para o artigo de Genest Rivest (1993)
fonte
Algumas medidas robustas de correlação são:
Coeficiente de correlação de classificação de Spearman
Coeficiente de correlação Signum (Blomqvist)
Kendall's Tau
Coeficiente de Correlação Absoluta de Bradley
Coeficiente de correlação Shevlyakov
Referências:
• Blomqvist, N. (1950) "Em uma medida de dependência entre duas variáveis aleatórias", Annals of Mathematics Statistics, 21 (4): 593-600. Bradley, C. (1985) "The Absolute Correlation", The Mathematical Gazette, 69 (447): 12-17. Shevlyakov, GL (1997), “Estimativa robusta de um coeficiente de correlação”, Journal of Mathematics Sciences, 83 (3): 434-438. • Spearman, C. (1904) "A prova e medição da associação entre duas coisas", American Journal of Psychology, 15: 88-93.
fonte
Correlação média de peso médio implementada em R (muito rápido) via WGCNA e em Python (não tão rápido) via astropia . Esse é o meu objetivo na análise de rede.
Para dados de composição esparsos, há também SparCC e FastSpar
fonte