A correlação = 0,2 significa que existe uma associação "em apenas 1 em cada 5 pessoas"?

48

No cérebro idiota: um neurocientista explica o que sua cabeça realmente está aprontando , escreveu Dean Burnett

A correlação entre altura e inteligência é geralmente citada como sendo de cerca de , o que significa que altura e inteligência parecem estar associadas em apenas 1 em cada 5 pessoas.0.215

Para mim, isso parece errado: entendo a correlação mais como o (falta de) erro que obtemos quando tentamos prever uma medida (aqui inteligência) se a única coisa que sabemos sobre essa pessoa é a outra medida (aqui altura). Se a correlação for ou - 1 , não cometeremos nenhum erro em nossa previsão, se a correlação for 0,8 , haverá mais erro. Assim, a correlação se aplicaria a qualquer um, não apenas a 1 em cada 5 pessoas.110.815

Eu olhei para esta pergunta, mas não sou bom o suficiente em matemática para entender a resposta. Esta resposta que fala sobre a força do relacionamento linear parece estar alinhada com a minha compreensão, mas não tenho certeza.

Sitak
fonte
6
@ JamesPhillips, o que você está se referindo é , não r em si. Se r = 0,2 então r 2 = 0,04, então 4%. r2rr=0.2r2=0.04
Richard Hardy
4
4 por cento faz muito mais sentido do que 20 por cento, obrigado pela correção, eu concordo com você.
James Phillips
29
Esta amostra de 0,01% do livro me faz pensar que bobagem é encontrada no resto ...
Nick Cox
11
Favoritei este post porque é precisamente o tipo de pergunta extremamente simples que, quando feita a um aluno de estatística 001 (ou qualquer outro neófito ou candidato a emprego), determina instantânea e inconfundivelmente se eles entendem o que significa correlação.
whuber
4
Eu pararia de ler esse livro, agora mesmo
PhD

Respostas:

69

A passagem citada é realmente incorreta. Um coeficiente de correlação quantifica o grau de associação em toda a população (ou amostra, no caso do coeficiente de correlação da amostra). Não divide a população em partes, com uma parte mostrando uma associação e a outra parte não. Ele poderia ser o caso de que a população na verdade consiste de duas subpopulações com diferentes graus de associação, mas um coeficiente de correlação por si só não implica este.

Kodiologist
fonte
19
Além disso, mesmo em uma população em que 20% das pessoas apresentaram correlação perfeita entre altura e inteligência e 80% mostraram correlação zero, a correlação em toda a população não é necessariamente 0,2. A afirmação está errada de várias maneiras!
Nuclear Wang
Coisas estranhas acontecem com tópicos que entram na lista de redes quentes. Esta resposta é obviamente correta e correta ... mas 57 votos positivos ?! :-)
ameba diz Reinstate Monica
2
@amoeba Se você acha isso selvagem, confira minha resposta com a pontuação mais alta .
Kodiologist
Haha, você é o mestre!
amoeba diz Reinstate Monica
Isso conta como trolling para +1 algo apenas para aumentar a estranheza que é SE?
Nat
18

Não, 0,2 não significa que 1 em cada 5 pessoas mostra correlação. Não sei como ele poderia escrever essa bobagem.

Aqui está a fonte do número 0.2: "Sobre as fontes da correlação altura-inteligência: novos insights de um modelo ACE bivariado com acasalamento assortativo", https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3044837/ Aparentemente, a correlação é robusta.

Eu já sabia disso: meu QI aumentava consideravelmente com a minha altura à medida que crescia. Agora eu sei por que não estou mais ficando mais inteligente: minha altura é estável.

Era uma piada, é claro, mas aponta o problema com o argumento do autor do livro "Idiota": ninguém mede dentro da correlação de altura e QI, pelo menos até onde eu sei. Não tenho certeza de como você faria isso de maneira limpa, haveria tanta confusão.

Dito isto, os pesquisadores estão usando truques como olhar para gêmeos e correlações familiares de altura e QI, isso os ajuda a resolver questões confusas. Presumivelmente, os gêmeos estão crescendo em um ambiente semelhante e têm o mesmo DNA; portanto, em estudos de observação, isso ajuda a abordar a endogeneidade e outras questões. No entanto, se você deixar isso de lado, a conclusão é que a "correlação 0,2" não dá base para dizer bobagens, como em algumas pessoas há correlação e em outras não. É apenas uma interpretação ridícula dos resultados do estudo de correlação.

Aksakal
fonte
8
-1: enquanto compreendo o espírito do último parágrafo desta resposta, acredito que aumenta a confusão, pois introduz desnecessariamente o conceito de causalidade (o whyaqui não é relevante).
Jorge Leitao 15/02
11
Você deve ser aquele em cada cinco para quem existe uma correlação.
Carsten S
@ JorgeLeitão Claro que não, nenhuma causa está implícita, eles cresceram juntos, é correlacional! :)
Firebug 15/02
@ JorgeLeitão, se alguma coisa a pesquisa da NN mostrar que tamanho importa. Um cérebro maior e uma amostra maior. Então, quando crescemos, nosso cérebro aumenta e corremos mais coisas através deles; portanto, devemos nos tornar mais inteligentes. Além disso, os homens são mais altos que as mulheres, em média, portanto, também devem ser mais inteligentes.
Aksakal
Hah, que monte de besteiras.
Lightness Races com Monica
8

A ironia na declaração é quase espessa demais para ser analisada. Dado o título do texto, estou assumindo que alguma coisa explícita foi intencional. No entanto, seu "instinto" de dizer que isso está errado provavelmente está no caminho certo, se a intuição conta para alguma coisa. Infelizmente, muitos relatórios científicos fogem à intuição ao lidar com conceitos que não encontramos.

XYXYXY

O acima é apenas uma interpretação possível de uma correlação de 0,2; é extremamente absurdo, porque poucas coisas na vida têm uma correlação de 1 ou 0 e menos coisas ainda têm modificação de efeito forte o suficiente para produzir correlações discrepantes.

AdamO
fonte
11
"É possível que, ao medir uma associação entre X e Y, a correlação entre X e Y seja 1,0 em 20% da população e 0 nos 80% restantes". - no estudo que publiquei, eles examinaram a família e as correlações entre gêmeos, são diferentes da população geral. No entanto, tenho certeza que não é o que o autor do livro significava, é como ele interpreta o que correlação é o problema
Aksakal
@Aksakal curiosamente, esses métodos de componentes de variação pretendem estimar a mesma correlação de nível populacional que seria medida em uma população, eles apenas afirmam usar herdabilidade para "raspar" a variação fenotípica atribuível à influência ambiental atual (o componente E da ECA modelo): fonte importante de confusão na hipótese considerada.
21418 AdamO em 14/02
10
Se a correlação é de 1 em 20% da população e 0 em 80%, não se segue que, em geral, seja 0,2. Depende da variação relativa em cada subpopulação.
Ameba diz Reinstate Monica
11
@amoeba Sim, bom ponto, ressalta ainda mais que um cenário idiopático justificaria tal afirmação.
21418 AdamO em 14/02
4
"Estou assumindo que alguma coisa explícita foi planejada." Você é mais caridoso do que eu seria. É simplesmente errado. Não vejo razão para pensar que o autor estivesse intencionalmente errado de uma maneira que deveria ser inteligente. A interpretação mais caridosa é que o autor queria sublinhar a natureza probabilística de uma correlação e, sem pensar, escolheu uma maneira ruim de ilustrá-la, uma maneira pela qual o próprio autor provavelmente concordaria que não faria sentido se fosse indicado a ele.
John Coleman
2

Seria difícil chegar a uma interpretação disso significativa, e muito menos correta. A associação não é uma propriedade de pontos de dados individuais. Se você tivesse apenas a altura e a inteligência de uma pessoa, como você poderia dizer se a altura e a inteligência estão associadas? Suponho que, se tivéssemos a média de altura e inteligência, poderíamos dizer que todos acima da média em ambas, ou abaixo da média em ambas, estão mostrando uma "associação". Mas se você tivesse dados completamente aleatórios (sem correlação), espere que metade das pessoas mostre "associação" nesse sentido. Gerei um conjunto de dados aleatórios com correlação em torno de 0,2 (na verdade, 22) e descobri que 55 mostravam "associação" nesse sentido.

É possível que Y seja uma função crescente de X, e a correlação entre eles seja apenas 0,5; seria bobagem dizer que apenas metade das pessoas mostra uma associação se toda pessoa tem uma inteligência mais alta que toda pessoa mais baixa e uma inteligência mais baixa que todos os mais altos. Além disso, é teoricamente possível ter um outlier criando toda a correlação, e a correlação do conjunto sem esse ponto é zero. É até possível que 20% da população tenha uma correlação negativa, e os outros 80% também tenham uma correlação negativa, e a correlação total seja 0,2.

Acumulação
fonte