Há um velho ditado: "Correlação não significa causalidade". Quando ensino, costumo usar os seguintes exemplos padrão para ilustrar esse ponto:
- número de cegonhas e taxa de natalidade na Dinamarca;
- número de padres na América e alcoolismo;
- no início do século XX, observou-se que havia uma forte correlação entre 'Número de rádios' e 'Número de pessoas em manicômios'
- e meu favorito: piratas causam aquecimento global .
No entanto, não tenho nenhuma referência para esses exemplos e, embora divertidos, eles são obviamente falsos.
Alguém tem outros bons exemplos?
correlation
teaching
csgillespie
fonte
fonte
Respostas:
Pode ser útil explicar que "causas" é uma relação assimétrica (X causa Y é diferente de Y causa X), enquanto "está correlacionado com" é uma relação simétrica.
Por exemplo, a população de rua e a taxa de criminalidade podem estar correlacionadas, pois ambas tendem a ser altas ou baixas nos mesmos locais. É igualmente válido dizer que a população de sem-teto está correlacionada com a taxa de criminalidade, ou a taxa de criminalidade está correlacionada com a população de sem-teto. Dizer que o crime causa falta de moradia ou populações desalojadas causam crime são afirmações diferentes. E a correlação não implica que ambas sejam verdadeiras. Por exemplo, a causa subjacente pode ser uma terceira variável, como abuso de drogas ou desemprego.
A matemática da estatística não é boa para identificar causas subjacentes, o que requer alguma outra forma de julgamento.
fonte
Meus favoritos:
1) Quanto mais bombeiros forem enviados ao fogo, mais danos serão causados.
2) Crianças que recebem tutoria obtêm notas piores do que crianças que não recebem tutoria
e (este é o meu melhor)
3) Nos primeiros anos do ensino fundamental, o signo astrológico está correlacionado com o QI, mas essa correlação enfraquece com a idade e desaparece na idade adulta.
fonte
Eu sempre gostei deste:
fonte: http://pubs.acs.org/doi/abs/10.1021/ci700332k
fonte
Às vezes, a correlação é suficiente. Por exemplo, no seguro de carro, os motoristas do sexo masculino estão correlacionados com mais acidentes; portanto, as companhias de seguros cobram mais. Não há como você realmente testar isso quanto à causalidade. Você não pode alterar os sexos dos drivers experimentalmente. O Google faturou centenas de bilhões de dólares não se importando com a causa.
Para encontrar a causalidade, você geralmente precisa de dados experimentais, não de dados observacionais. Embora, na economia, eles usem frequentemente "choques" observados no sistema para testar a causa, como se um CEO morresse repentinamente e o preço das ações aumentasse, você pode assumir a causa.
A correlação é uma condição necessária, mas não suficiente, para a causação. Mostrar causalidade requer uma contrafação.
fonte
Eu tenho alguns exemplos que eu gosto de usar.
Ao investigar a causa do crime na cidade de Nova York nos anos 80, quando tentavam limpar a cidade, um acadêmico encontrou uma forte correlação entre a quantidade de crimes graves cometidos e a quantidade de sorvete vendido pelos vendedores ambulantes! (Qual é a causa e qual é o efeito?) Obviamente, havia uma variável não observada causando ambas. Os verões são quando o crime é o maior e quando mais sorvete é vendido.
O tamanho da palma da mão está negativamente correlacionado com quanto tempo você viverá (realmente!). De fato, as mulheres tendem a ter palmas menores e a viver mais.
[Meu favorito] Ouvi falar de um estudo de alguns anos atrás, que descobriu que a quantidade de refrigerante que uma pessoa bebe está correlacionada positivamente com a probabilidade de obesidade.(Eu disse a mim mesmo - isso faz sentido, pois deve ser devido a pessoas que bebem refrigerante açucarado e recebem todas essas calorias vazias.) Alguns dias depois, mais detalhes foram revelados. Quase toda a correlação ocorreu devido ao aumento do consumo de refrigerantes dietéticos. (Isso estragou minha teoria!) Então, qual é a causa? Os refrigerantes da dieta fazem com que alguém engorde, ou um ganho de peso causa um aumento no consumo de refrigerantes? (Antes de concluir que é o último, consulte o estudo em que um experimento controlado com ratos mostrou que o grupo que recebeu um iogurte com adoçante artificial ganhou mais peso do que o grupo que recebeu o iogurte normal.) Duas referências: Beba mais refrigerante diet , Ganhar mais peso? ; Refrigerantes dietéticos associados à obesidade. Eu acho que eles ainda estão tentando resolver isso.
fonte
O número de prêmios Nobel conquistados por um país (ajustando-se à população) correlaciona-se bem com o consumo per capita de chocolate. ( New England Journal of Medicine )
fonte
Embora seja mais uma ilustração do problema de múltiplas comparações, também é um bom exemplo de causalidade não atribuída:
Rugby (a religião do país de Gales) e sua influência na igreja católica: o papa Bento XVI deve se preocupar?
fonte
Há dois aspectos desse problema post hoc ergo propter hoc que eu gosto de abordar: (i) causalidade reversa e (ii) endogeneidade
Um exemplo de causalidade reversa "possível": bebida social e ganhos - os bebedores ganham mais dinheiro de acordo com Bethany L. Peters e Edward Stringham (2006. "Nada de bebida? Você pode perder: por que os bebedores ganham mais dinheiro do que os que não bebem", Journal of Labor Research, Transaction Publishers, volume 27 (3), páginas 411-421, junho). Ou as pessoas que ganham mais dinheiro bebem mais porque têm uma maior renda disponível ou devido ao estresse? Este é um ótimo artigo para discutir por todos os tipos de razões, incluindo erro de medição, viés de resposta, causalidade, etc.
Um exemplo de endogeneidade "possível": a Equação de Mincer explica os ganhos de log por educação, experiência e experiência ao quadrado. Há uma longa literatura sobre esse tópico. Os economistas do trabalho querem estimar a relação causal da educação sobre os ganhos, mas talvez a educação seja endógena porque a "habilidade" pode aumentar a quantidade de educação que um indivíduo possui (diminuindo o custo de obtê-la) e pode levar a um aumento nos ganhos, independentemente de o nível de educação. Uma solução potencial para isso pode ser uma variável instrumental. O livro de Angrist e Pischke, Mostly Harmless Econometrics, trata disso e relaciona os tópicos com grande detalhe e clareza.
Outros exemplos bobos aos quais não tenho apoio incluem: - Número de televisões per capita e número de taxas de mortalidade. Então, vamos enviar TVs para países em desenvolvimento. Obviamente, ambos são endógenos a algo como o PIB. - Número de ataques de tubarão e vendas de sorvetes. Ambos são endógenos à temperatura, talvez?
Também gosto de contar a piada terrível sobre o lunático e a aranha. Um lunático está vagando pelos corredores de um asilo com uma aranha que está carregando na palma da mão. Ele vê o médico e diz: "Olha, doutor, eu posso falar com aranhas. Observe isso." Aranha, vá para a esquerda! "A aranha se move para a esquerda. Ele continua:" Aranha, vá para a direita. " O médico responde: "Interessante, talvez devêssemos conversar sobre isso na próxima sessão de grupo." Os lunáticos retrucam: "Isso não é nada, doc. Observe isso. ”Ele puxa cada uma das pernas da aranha uma por uma e depois grita:“ Aranha, vá para a esquerda! ”A aranha fica imóvel na palma da mão e o lunático vira-se para o médico e conclui:“ Se você arrancar a aranha, pernas, ele ficará surdo. "
fonte
O melhor que me ensinaram foi o número de afogamentos e as vendas de sorvetes podem estar altamente correlacionadas, mas isso não implica que uma causa a outra. Afogamentos e vendas de sorvete são obviamente mais altos nos meses de verão, quando o tempo está bom. A terceira variável, também conhecida como clima bom, as causa.
fonte
Como generalização de 'piratas causam aquecimento global': escolha duas quantidades que estão (monotonicamente) aumentando ou diminuindo com o tempo e você deve ver alguma correlação.
fonte
Você pode gastar alguns minutos no Google Correlate e criar todos os tipos de correlações espúrias.
fonte
Eu trabalho com alunos no ensino de correlação versus causalidade nas minhas aulas de Álgebra Um. Examinamos muitos exemplos possíveis. Encontrei o artigo Bebês em pacotes e sorvete perigoso: quebra-cabeças de correlação do professor de matemática de fevereiro de 2013 para ser útil. Eu gosto da idéia de falar sobre "variáveis ocultas". Além disso, esse desenho animado é um começo de conversa fofo:
Identificamos a variável independente e dependente no desenho animado e falamos sobre se este é um exemplo de causalidade, se não por que não.
fonte
Eu li (há muito tempo) de um exemplo interessante sobre um declínio nas taxas de natalidade (ou taxas de fertilidade, se você preferir essa medida), especialmente nos EUA, a partir do início dos anos 60, já que os testes de armas nucleares estavam em alta histórica. (em 1961, a maior bomba nuclear já detonada foi testada na URSS). As taxas continuaram a ser definidas até o final do século XX, quando a maioria dos países finalmente parou de fazer isso.
Não consigo encontrar uma referência que combine esses números agora, mas este artigo da Wikipedia tem números sobre os números de testes de armas nucleares por país.
Certamente, poderia fazer mais sentido observar a correlação da taxa de natalidade com a introdução e a legalização da pílula anticoncepcional 'coincidentemente' a partir do início dos anos 1960. (Apenas em alguns estados primeiro, depois em todos os estados somente para mulheres casadas, depois para solteiros e depois em geral), mas mesmo isso poderia ser apenas parte da causa; muitos outros aspectos de igualdade, mudanças econômicas e outros fatores desempenham um papel significativo.
fonte
Uma correlação por si só nunca pode estabelecer um nexo de causalidade. David Hume (1771-1776) argumentou com bastante eficácia que não podemos obter certo conhecimento de cauasalidade por meios puramente empíricos. Kant tentou resolver isso, a página da Wikipedia para Kant parece resumir bastante bem:
Em outras palavras, Hume nos diz que nunca podemos saber que existe um relacionamento causal apenas observando uma correlação, mas Kant sugere que podemos usar nossa razão para distinguir entre correlações que implicam um vínculo causal daquelas que não o fazem. Eu não acho que Hume teria discordado, desde que Kant estivesse escrevendo em termos de plausibilidade, e não de certo conhecimento.
Em suma, uma correlação fornece evidência circunstancial que implica um nexo de causalidade, mas o peso da evidência depende muito das circunstâncias particulares envolvidas, e nunca podemos ter certeza absoluta. A capacidade de prever os efeitos das intervenções é uma maneira de obter confiança (não podemos provar nada, mas podemos refutar por evidências observacionais; portanto, pelo menos tentamos falsificar a teoria de um nexo de causalidade). Ter um modelo simples que explica por que devemos observar uma correlação que também explica outras formas de evidência é outra maneira de aplicar nosso raciocínio, como sugere Kant.
Advertência: É perfeitamente possível que eu tenha entendido mal a filosofia, no entanto, continua a ser o caso de uma correlação nunca fornecer prova de um nexo de causalidade.
fonte
fonte
A citação padrão que aponta a correlação entre o número de bebês recém-nascidos e os pares reprodutores de cegonhas na Alemanha Ocidental é um novo parâmetro para educação sexual , Nature 332, 495 (07 de abril de 1988); doi: 10.1038 / 332495a0
fonte
A contagem de espermatozóides nos machos das aldeias eslovenas e o número de ursos (também na Eslovênia) mostram uma correlação negativa. Algumas pessoas acham isso muito preocupante. Vou tentar obter o estudo que fez isso.
fonte
Estive recentemente em uma conferência e um dos palestrantes deu esse exemplo muito interessante (embora o objetivo fosse ilustrar outra coisa):
Americanos e ingleses comem muita comida gorda. Há uma alta taxa de doenças cardiovasculares nos EUA e no Reino Unido.
Os franceses comem muita comida gordurosa, mas têm uma baixa (er) taxa de doenças cardiovasculares.
Americanos e ingleses bebem muito álcool. Há uma alta taxa de doenças cardiovasculares nos EUA e no Reino Unido.
Os italianos bebem muito álcool, mas, novamente, eles têm uma baixa (er) taxa de doenças cardiovasculares.
A conclusão? Coma e beba o que quiser. E você tem uma chance maior de sofrer um ataque cardíaco se falar inglês!
fonte
Esse desenho animado do XKCD também está publicado em outro local no CrossValidated.
fonte
Outro exemplo de correlação que usei é o grande aumento no número de pessoas que comem alimentos orgânicos e o aumento no número de crianças diagnosticadas com autismo nos EUA. Há um gráfico de paródia na Web -
fonte
http://tylervigen.com/
Isso mostra uma tonelada de correlações que obviamente não têm nada a ver com causalidade - ou você tem alguma boa idéia de qual é a causa da correlação de Age of Miss America que se correlaciona com assassinatos por vapor, vapores quentes e objetos quentes?
??
fonte
Ensinar "correlação não significa causalidade" não ajuda ninguém, porque no final do dia todos os argumentos dedutivos se baseiam em parte na correlação.
Humanos são muito ruins em aprender a não fazer algo.
O objetivo deve ser construtivo: sempre pense em alternativas às suas suposições iniciais que possam produzir os mesmos dados.
fonte
Bem, meu Prof. usou isso na classe de probabilidade introdutória:
1) O tamanho do sapato está correlacionado com a capacidade de leitura
2) O ataque de tubarão está relacionado à venda de sorvete.
fonte
Quanto mais carros de bombeiros forem enviados para o fogo, maiores serão os danos.
fonte
Eu acho que um paradigma melhor pode ser uma causa que requer correlação associada a um mecanismo credível e de preferência comprovado. Eu acho que a palavra implicar deve ser usada com moderação nesse contexto, pois tem vários significados, incluindo o de sugestão.
fonte
O exemplo das cegonhas está na página 8 da primeira edição (1978) do livro de Box, Hunter & Hunter, intitulado "Statistics for Experimenters ..." (Wiley). Não sei se está na 2ª edição. Eles identificam a cidade como Oldenburg e o período de 1930-1936.
Eles se referem à Ornithologische Monatsberichte , 44 , n. 2, Jahrgang, 1936, Berlim, e 48 , n. 1, Jahrgang, 1940, Berlim, e Statistiches Jahrbuch Deutscher Gemeinden , 27-33, 1932-1938, Gustav Fischer, Jena.
fonte
Eu vi um engraçado em um artigo.
A produção de manteiga em Bangladesh tem uma das maiores correlações com o S&P 500 em um período de dez anos.
fonte
Aqui está um perfeito. E, infelizmente, pode ser usado como um excelente ponto de ensino, porque nem a equipe do Washington Post nem os Centros de Controle e Prevenção de Doenças demonstram qualquer indício de que o artigo seja uma peça de sátira em The Onion.
https://www.washingtonpost.com/health/trumps-presidency-may-be-making-latinos-sick/2019/07/19/4e89b9f0-a97f-11e9-9214-246e594de5d5_story.html?utm_term=.9dd329c2e837
fonte
Alguém disse que a correlação pode não significar causalidade, mas certamente pode ser uma boa dica :)
Ok, deixando de lado a parte divertida, o que exatamente é causalidade? Temos certeza de que os piratas não causam aquecimento global?
Contra-intuitivo, mas o que é tomado como causa e o que como efeito (em um estudo de correlação não é tão claro). É claro que muitas vezes ambos podem ser apenas efeitos de causa comum (e, portanto, correlacionados)
Tudo se resume ao método de determinação da causa.
Esta é a causa (trocadilho intencional) do ditado:
Existem pequenas mentiras. Há grandes mentiras E há estatísticas.
fonte