Como interpretar o coeficiente de correlação de Matthews (MCC)?

17

A resposta para a pergunta Relação entre os coeficientes de correlação phi, Matthews e Pearson? mostra que os três métodos de coeficiente são todos equivalentes.

Não sou da estatística, então deve ser uma pergunta fácil.

O artigo de Matthews (www.sciencedirect.com/science/article/pii/0005279575901099) descreve o seguinte:

"A correlation of:
   C =  1 indicates perfect agreement,
   C =  0 is expected for a prediction no better than random, and
   C = -1 indicates total disagreement between prediction and observation"`.

De acordo com a Wikipedia ( http://en.wikipedia.org/wiki/Pearson_product-moment_correlation_coefficient ), a correlação de Pearson é descrita como:

giving a value between +1 and −1 inclusive, where:
   1 is total positive correlation, 
   0 is no correlation, and
  −1 is total negative correlation

A interpretação do coeficiente de correlação de Pearson é melhor entendida como a seguinte (de acordo com http://faculty.quinnipiac.edu/libarts/polsci/Statistics.html ):

If r =
   +.70 or higher Very strong positive relationship
   +.40 to +.69 Strong positive relationship
   +.30 to +.39 Moderate positive relationship
   +.20 to +.29 weak positive relationship
   +.01 to +.19 No or negligible relationship
   -.01 to -.19 No or negligible relationship
   -.20 to -.29 weak negative relationship
   -.30 to -.39 Moderate negative relationship
   -.40 to -.69 Strong negative relationship
   -.70 or higher Very strong negative relationship

Lendo alguns artigos, não há grau de interpretação para o intervalo de resultados da MCC entre -1 e 1. Esse coeficiente é bom para conjuntos de dados desequilibrados de negativos e positivos, onde a métrica de precisão não pode estimar bem se o preditor for preciso nesse caso.

Com conjuntos de dados desequilibrados, a medida F é uma boa métrica para comparar com a MCC para avaliar o desempenho do preditor? Por exemplo: existem casos em que F-measure = 94%e MCC = 0.58. O que isso diz sobre o preditor?

Posso adotar a mesma interpretação para o coeficiente de correlação de Matthews, ou há algum significado diferente na interpretação? Eu acredito que ambos os coeficientes são equivalentes na interpretação também.

daniel souza
fonte

Respostas:

9

Essa pergunta era tão simples e, infelizmente, ninguém conseguiu responder a essa pergunta.

De acordo com este documento: http://www.bioinfopublication.org/files/articles/2_1_1_JMLT.pdf , o MCC é um método de matriz de contingência para calcular o coeficiente de correlação produto-momento da Pearson. Portanto, tem a mesma interpretação.

daniel souza
fonte
0

O coeficiente de correlação de Matthews é um caso especial do coeficiente de correlação de Pearson. Portanto, as interpretações para os dois são as mesmas. Verifique as derivações e outros detalhes no meu post no github .

Lei Mao
fonte
1
Bem vindo ao site. Estamos tentando construir um repositório permanente de informações estatísticas de alta qualidade na forma de perguntas e respostas. Portanto, temos receio de respostas somente para links, devido ao linkrot. É melhor postar o conteúdo aqui e criar um link para o contexto. Você também deve ser explícito que a postagem vinculada é sua.
gung - Restabelece Monica