A correlação é equivalente à associação?

27

Meu professor de estatística afirma que a palavra "correlação" se aplica estritamente às relações lineares entre as variáveis, enquanto a palavra "associação" se aplica amplamente a qualquer tipo de relação. Em outras palavras, ele afirma que o termo "correlação não linear" é um oxímoro.

Pelo que posso entender desta seção no artigo da Wikipedia sobre " Correlação e dependência ", o coeficiente de correlação de Pearson descreve o grau de "linearidade" na relação entre duas variáveis. Isso sugere que o termo "correlação" se aplica de fato exclusivamente a relacionamentos lineares.

Por outro lado, uma rápida pesquisa no Google por " correlação não linear " exibe vários artigos publicados que usam o termo.

Meu professor está correto ou "correlação" é simplesmente sinônimo de "associação"?

Asad Saeeduddin
fonte
1
Por outro lado, há também 'associação linear'.
Bogdanovist

Respostas:

37

Não; correlação não é equivalente a associação. No entanto, o significado da correlação depende do contexto.

A definição clássica de estatística é, para citar a Enciclopédia de Ciências Estatísticas de Kotz e Johnson "uma medida da força da relação linear entre duas variáveis ​​aleatórias". Nas estatísticas matemáticas, a "correlação" parece geralmente ter essa interpretação.

Nas áreas aplicadas em que os dados são geralmente ordinais e não numéricos (por exemplo, psicometria e pesquisa de mercado), essa definição não é tão útil quanto o conceito de linearidade assume dados com propriedades de escala de intervalo. Consequentemente, nesses campos, a correlação é interpretada como indicando um padrão bivariado monotonicamente crescente ou decrescente ou uma correlação das fileiras. Várias estatísticas de correlação não paramétrica foram desenvolvidas especificamente para isso (por exemplo, correlação de Spearman e tau-b de Kendall). Às vezes, elas são chamadas de "correlações não lineares" porque são estatísticas de correlação que não assumem linearidade.

Entre os não estatísticos, a correlação geralmente significa associação (algumas vezes com e outras sem conotação causal). Independentemente da etimologia da correlação, a realidade é que, entre os não estatísticos, ele tem esse significado mais amplo e nenhuma quantidade de punição por uso inadequado provavelmente mudará isso. Eu fiz um "google" e parece que alguns dos usos da correlação não linear parecem ser desse tipo (em particular, parece que algumas pessoas usam o termo para denotar uma relação não linear suave entre variáveis ​​numéricas) .

A natureza dependente do contexto do termo "correlação não linear" talvez signifique que é ambíguo e não deve ser usado. No que diz respeito à "correlação", você precisa descobrir o contexto da pessoa que usa o termo para saber o que ela significa.

Tim
fonte
6
+1 Uma resposta atenciosa e experiente. Por favor, considere qualificar o "não" inicial, pois é necessário um pouco de leitura e compreensão para entender se significa "não, o professor não está correto" ou "não, 'correlação' não é sinônimo de 'causalidade'" ou a conjunção dos dois.
whuber
Obrigado pelo comentário; Eu editei minha resposta de acordo.
Tim
1
Esta é uma excelente resposta (e pergunta) que traz algumas questões mais amplas sobre terminologia, linguagem e comunicação em geral, com as quais todos precisamos cuidar.
Peter Ellis
3
Então, o que é associação, então?
Ovelha
5

Não vejo muito sentido tentar separar os termos "correlação" e "associação". Afinal, o próprio Pearson (e outros) desenvolveu uma medida de relacionamento não linear que eles chamaram de " razão de correlação ".

user28193
fonte
1
Sim, parece que nesse momento eles são bastante difíceis de desvendar, especialmente considerando a história (por exemplo, como você mencionou) e a percepção social.
21813 Behacad
2

Parece haver um mal-entendido de associação. Medidas de associação (tamanho do efeito) são inerentes à análise quantitativa, não qualitativa.

Scott Howell
fonte
1
Talvez você deva pensar em transformar isso em um comentário. As respostas são geralmente um pouco mais ampliadas
PhD
@Alessandro Yup, mais necessário para uma resposta, mas o OP não tem reputação suficiente (> +50) para comentar ainda. Talvez o moderador possa convertê-lo em um comentário para ele.
Carl
0

Eu diria que a correlação se aplica a dados quantitativos e a associação a dados qualitativos e ambos não têm relação causal obrigatória.

Jean Turgeon
fonte
O que você quer dizer com "associação a dados qualitativos"?
Randel
0

A idéia de que o peso (de um homem) não está correlacionado com a altura (porque a função correspondente é de terceiro grau, não linear) me parece muito estranha. A correlação linear deve ser tratada como um caso especial de associação.

Krzysztof Szymanek
fonte
1
Mas contra qual (ou de quem) idéia você está argumentando? A correlação pode ser calculada aqui como (b) correlação entre valores observados e previstos de qualquer combinação de termos, bem como (presumivelmente) (a) correlação diferente de zero entre peso e altura.
Nick Cox
-1

Correlação e associação são diferentes. A correlação descreve os três tipos de relacionamento positivo, negativo e não correlacionado. Também descreve a magnitude da correlação de 0 a 1, de -1 a 0. A associação não revela que tipos de associação e quanto.

Rabindra Ghimire
fonte
Qual é a pergunta aqui?
Christoph Hanck
Como você não define associação nem explica como ela difere, é difícil entender por que você acha que respondeu à pergunta. Isso não adiciona respostas anteriores.
Nick Cox
-2

No que diz respeito à linearidade, a resposta de Tim e Nick Cox a cobriu completamente. Onde pensei que poderia contribuir é uma maneira clara de pensar sobre a diferença entre associação e correlação.

Associação --- mede quão estreitamente relacionadas são duas variáveis ​​(isto é, se são dependentes ou independentes).

Correlação - mede de que maneira duas variáveis ​​estão relacionadas (ou seja, positivas ou negativas).


No final, eu argumentaria que você nunca pode dar errado tratá-los distintamente, isso ajudará na interpretação e análise a longo prazo. Espero que isto ajude.

Dan Temkin
fonte
2
Não neguei isso e obrigado pelo comentário positivo (acabei de aplicar uma edição). Infelizmente, isso atrapalha a discussão. As medidas de associação geralmente não têm nada a ver com qual variável, se houver, é dependente. A correlação mede "com que proximidade" também: cada definição de correlação é baseada em uma definição específica da maneira como as variáveis ​​são (idealmente) relacionadas (linearmente, monotonicamente etc.). Os exemplos de família realmente não ajudam, mesmo como analogias: por exemplo, mãe, pai, tio não são variáveis ​​quantitativas no exemplo. Então, desculpe, mas a distinção que você faz não é nada limpa.
Nick Cox
Além disso, "sangue compartilhado" e "estranhamento" são bem diferentes!
Nick Cox