Meu professor de estatística afirma que a palavra "correlação" se aplica estritamente às relações lineares entre as variáveis, enquanto a palavra "associação" se aplica amplamente a qualquer tipo de relação. Em outras palavras, ele afirma que o termo "correlação não linear" é um oxímoro.
Pelo que posso entender desta seção no artigo da Wikipedia sobre " Correlação e dependência ", o coeficiente de correlação de Pearson descreve o grau de "linearidade" na relação entre duas variáveis. Isso sugere que o termo "correlação" se aplica de fato exclusivamente a relacionamentos lineares.
Por outro lado, uma rápida pesquisa no Google por " correlação não linear " exibe vários artigos publicados que usam o termo.
Meu professor está correto ou "correlação" é simplesmente sinônimo de "associação"?
fonte
Respostas:
Não; correlação não é equivalente a associação. No entanto, o significado da correlação depende do contexto.
A definição clássica de estatística é, para citar a Enciclopédia de Ciências Estatísticas de Kotz e Johnson "uma medida da força da relação linear entre duas variáveis aleatórias". Nas estatísticas matemáticas, a "correlação" parece geralmente ter essa interpretação.
Nas áreas aplicadas em que os dados são geralmente ordinais e não numéricos (por exemplo, psicometria e pesquisa de mercado), essa definição não é tão útil quanto o conceito de linearidade assume dados com propriedades de escala de intervalo. Consequentemente, nesses campos, a correlação é interpretada como indicando um padrão bivariado monotonicamente crescente ou decrescente ou uma correlação das fileiras. Várias estatísticas de correlação não paramétrica foram desenvolvidas especificamente para isso (por exemplo, correlação de Spearman e tau-b de Kendall). Às vezes, elas são chamadas de "correlações não lineares" porque são estatísticas de correlação que não assumem linearidade.
Entre os não estatísticos, a correlação geralmente significa associação (algumas vezes com e outras sem conotação causal). Independentemente da etimologia da correlação, a realidade é que, entre os não estatísticos, ele tem esse significado mais amplo e nenhuma quantidade de punição por uso inadequado provavelmente mudará isso. Eu fiz um "google" e parece que alguns dos usos da correlação não linear parecem ser desse tipo (em particular, parece que algumas pessoas usam o termo para denotar uma relação não linear suave entre variáveis numéricas) .
A natureza dependente do contexto do termo "correlação não linear" talvez signifique que é ambíguo e não deve ser usado. No que diz respeito à "correlação", você precisa descobrir o contexto da pessoa que usa o termo para saber o que ela significa.
fonte
Não vejo muito sentido tentar separar os termos "correlação" e "associação". Afinal, o próprio Pearson (e outros) desenvolveu uma medida de relacionamento não linear que eles chamaram de " razão de correlação ".
fonte
Parece haver um mal-entendido de associação. Medidas de associação (tamanho do efeito) são inerentes à análise quantitativa, não qualitativa.
fonte
Eu diria que a correlação se aplica a dados quantitativos e a associação a dados qualitativos e ambos não têm relação causal obrigatória.
fonte
A idéia de que o peso (de um homem) não está correlacionado com a altura (porque a função correspondente é de terceiro grau, não linear) me parece muito estranha. A correlação linear deve ser tratada como um caso especial de associação.
fonte
Correlação e associação são diferentes. A correlação descreve os três tipos de relacionamento positivo, negativo e não correlacionado. Também descreve a magnitude da correlação de 0 a 1, de -1 a 0. A associação não revela que tipos de associação e quanto.
fonte
No que diz respeito à linearidade, a resposta de Tim e Nick Cox a cobriu completamente. Onde pensei que poderia contribuir é uma maneira clara de pensar sobre a diferença entre associação e correlação.
Associação --- mede quão estreitamente relacionadas são duas variáveis (isto é, se são dependentes ou independentes).
Correlação - mede de que maneira duas variáveis estão relacionadas (ou seja, positivas ou negativas).
No final, eu argumentaria que você nunca pode dar errado tratá-los distintamente, isso ajudará na interpretação e análise a longo prazo. Espero que isto ajude.
fonte