O coeficiente de Pearson entre duas variáveis é bastante alto (r = 0,65). Mas quando eu classifico os valores das variáveis e corro a correlação de Spearman, o valor de cofficient é muito menor (r = 0,30).
- Qual é a interpretação disso?
correlation
spearman-rho
user3671
fonte
fonte
Respostas:
Por que a grande diferença
Se seus dados são normalmente distribuídos ou uniformemente distribuídos, eu acho que a correlação de Spearman e Pearson deve ser bastante semelhante.
Se eles estão apresentando resultados muito diferentes, como no seu caso (0,65 versus 0,30), meu palpite é que você distorceu os dados ou discrepantes, e que discrepantes estão levando a correlação de Pearson a ser maior que a correlação de Spearman. Ou seja, valores muito altos em X podem co-ocorrer com valores muito altos em Y.
Perguntas relacionadas
Veja também estas perguntas anteriores sobre as diferenças entre a correlação de Spearman e Pearson:
Como escolher entre a correlação de Pearson e Spearman?
Correlação de Pearson ou Spearman com dados não normais
Exemplo simples de R
A seguir, é apresentada uma simulação simples de como isso pode ocorrer. Observe que o caso abaixo envolve um único outlier, mas você pode produzir efeitos semelhantes com vários outliers ou dados distorcidos.
O que dá essa saída
A análise de correlação mostra que, sem Spearman e Pearson discrepantes, são bastante semelhantes e, com os discrepantes extremos, a correlação é bem diferente.
O gráfico abaixo mostra como tratar os dados como fileiras remove a extrema influência do discrepante, levando Spearman a ser semelhante tanto com quanto sem discrepante, enquanto Pearson é bem diferente quando o discus é adicionado. Isso destaca por que Spearman é frequentemente chamado de robusto.
fonte