Estou usando R para análise de dados. R fornece uma corr
função para calcular a correlação. Esta função fornece três abordagens / algoritmos diferentes para estimar corr
quais são Pearson, Spearman e Kendall. Quando devo usar cada um desses métodos? Quais fatores determinam qual método deve ser usado?
correlation
r
asheeshr
fonte
fonte
Respostas:
O coeficiente produto-momento de Pearson (parâmetro pearson) mede a correlação linear entre variáveis. Portanto, é apropriado quando sua correlação suspeita é linear, que pode ser inspecionada visualmente com um gráfico.
O coeficiente de Kendall Tau (parâmetro de Kendall) e o coeficiente de correlação de Spearman (parâmetro de Spearman) são correlações de classificação de medidas. Portanto, a correlação entre as duas variáveis não precisa ser linear. O método spearman é basicamente o método pearson, mas aplicado nas fileiras dos valores (a classificação de um valor é dada por sua posição após a classificação dos valores). O método kendal é construído basicamente como uma estatística na forma de uma relação entre o número adicional de pares ordenados e o número total de pares. Para o método kendal, por ser construído como uma estatística, também é possível usá-lo na estrutura do teste de hipóteses, com todos os benefícios (é chamado teste tau).
Todos esses métodos são instrumentos utilizados para inferir algo sobre as dependências entre variáveis aleatórias. Veja mais na página dedicada da Wikipedia dedicada à Correlação e Dependência
fonte