Como se verifica a causa?

9

Depois de mostrarmos que duas quantidades estão correlacionadas, como inferimos que o relacionamento é causal? E, além disso, qual causa o quê? Agora, em teoria, pode-se usar uma "atribuição aleatória" (seja qual for a palavra certa), para quebrar qualquer vínculo de acidente que possa existir entre duas variáveis. Mas, em alguns casos, isso não é possível. Por exemplo, considere a frequência com que uma pessoa fuma, medida em cigarros por semana, versus a expectativa de vida, medida em anos. Podemos escolher aleatoriamente dois grupos de pessoas. Faça um grupo fumar e o outro não. Como a tarefa é aleatória, isso deve interromper qualquer outra relação entre eles. Mas é claro que isso não é possível por muitas razões diferentes. Então, quais são algumas das técnicas que podem ser usadas?

Nicolas Bourbaki
fonte
1
Através de experimentos cuidadosamente planejados. ;-)
StatsStudent
@StatsStudent Quais experiências? Tomemos, por exemplo, cigarros versus expectativa de vida. Deseja realmente fazer esse experimento, sob algum tipo de condição de controle, se você acha que eles diminuem a expectativa de vida? Com experimentos, é fácil verificar a causa. Mas como se faz isso a partir de um gráfico de correlação?
Nicolas Bourbaki
@NicolasBourbaki, sua pergunta começa assumindo que as quantidades estão correlacionadas. Isso implica que também estamos assumindo que as variáveis ​​estão relacionadas de maneira linear, como Y = A * X + B?
Cantorhead 5/03
@NicolasBourbaki Pode-se definir e muitos pensam de como "causando" . Por outro lado, e não estão correlacionados. X Y X ( t ) Y ( t + 1 )Y(t+1)=cos(X(t))1+noiseXYX(t)Y(t+1)
cantorhead
@NicolasBourbaki Forneci uma resposta assumindo linearidade abaixo e gostaria de fornecer uma resposta mais geral, mas seria fora de tópico se você estiver interessado apenas em relacionamentos lineares.
cantorhead

Respostas:

5

Eu acho que essa é uma pergunta muito boa. Encontro esse problema frequentemente e reflito muito sobre ele. Eu pesquiso em ciências médicas e a noção em medicina é que nada é provado causal, nunca, nunca, nunca, até que um ensaio clínico randomizado controlado, de preferência com uma pílula (ou qualquer outra exposição que possa ser tripla), tenha provado um efeito na resposta de interesse. Isso é bastante triste, pois todos os outros estudos são considerados estudos de associação, que tendem a reduzir seu impacto.

Hill e Richard Doll pensaram sobre isso. O primeiro formulou os critérios de Hill para causalidade:

Os critérios de Bradford Hill, também conhecidos como critérios de causalidade de Hill, são um grupo de condições mínimas necessárias para fornecer evidência adequada de uma relação causal entre uma incidência e uma conseqüência, estabelecida pelo epidemiologista inglês Sir Austin Bradford Hill (1897–1991) em 1965


Força : Uma associação pequena não significa que não há um efeito causal, embora quanto maior a associação, maior a probabilidade de ela ser causal. Consistência : achados consistentes observados por pessoas diferentes em lugares diferentes com amostras diferentes fortalecem a probabilidade de um efeito. Especificidade : É provável que a causa seja uma população muito específica em um local específico e doença sem outra explicação provável. Quanto mais específica uma associação entre um fator e um efeito, maior a probabilidade de um relacionamento causal. Temporalidade : o efeito deve ocorrer após a causa (e se houver um atraso esperado entre a causa e o efeito esperado, o efeito deverá ocorrer após esse atraso). Gradiente biológico : Uma maior exposição geralmente deve levar a uma maior incidência do efeito. No entanto, em alguns casos, a mera presença do fator pode desencadear o efeito. Em outros casos, uma proporção inversa é observada: maior exposição leva a menor incidência. Plausibilidade : Um mecanismo plausível entre causa e efeito é útil (mas Hill observou que o conhecimento do mecanismo é limitado pelo conhecimento atual). Coerência : a coerência entre os resultados epidemiológicos e laboratoriais aumenta a probabilidade de um efeito. No entanto, Hill observou que "... a falta de tais evidências [laboratoriais] não pode anular o efeito epidemiológico nas associações". Experiência : "Ocasionalmente, é possível apelar para evidências experimentais". Analogia : O efeito de fatores semelhantes pode ser considerado.


Isso foi formulado há cerca de 50 anos, antes do advento de estudos randomizados (que podem não ser do seu interesse), mas é digno de nota que os experimentos não tiveram um papel crucial nos critérios de Hill.

Eu gostaria de pensar que os dados observacionais, se analisados ​​com métodos estatísticos adequados, permitem inferências de causalidade. (É claro que isso depende de muitos fatores.) Mas, no meu campo, quando se trata de mudar o gerenciamento de pacientes, é raro ver diretrizes moldadas por algo que não seja ensaios clínicos randomizados e o prelúdio de diretrizes frequentemente enfatiza que certa causalidade só pode ser obtido em ensaios randomizados.

Agora eu sei que muitos de vocês não vão concordar comigo. Também não concordo comigo. Mas isso pode aumentar a discussão.

Adam Robinsson
fonte
"(que pode não ser do seu interesse)" Meu interesse é geometria algébrica e aritmética. Que é o mais distante das estatísticas que se possa imaginar. Eu só pergunto isso por curiosidade.
Nicolas Bourbaki
2

O Statistics fornece ferramentas para detectar e modelar regularidades nos dados. O processo de modelagem geralmente é guiado pelo conhecimento do assunto. Quando o modelo representa o mecanismo do objeto, as propriedades estatísticas do modelo estimado informam se os dados estão em desacordo com o mecanismo modelado. Em seguida, a causalidade (ou a falta dela) é inferida - e isso é feito no domínio do objeto .

Um exemplo: suponha que você tenha uma amostra aleatória de duas variáveis e . A correlação entre eles é grande e estatisticamente significativa.yxy

Até agora, você pode dizer se causa ? Acho que não.yxy





Richard Hardy
fonte
0

Atualmente, a pergunta assume que as quantidades estão correlacionadas, o que implica que a pessoa que determina a correlação deve ter boas razões para acreditar que as variáveis ​​compartilham um relacionamento linear.

A causalidade de Granger pode ser a melhor ferramenta para determinar relações causais lineares. Granger foi um economista que compartilhou um prêmio nobel por seu trabalho sobre Causação linear.

{Xt(i)}i=1kYt

  1. A causa deve ocorrer antes do efeito.
  2. A causa deve conter informações sobre o efeito que não está disponível de outra forma.

X=[Xt1(1),Xt2(1),,Xtm(1),Xt1(2),Xt2(2),,Xtm(2),,Xtm(k)]TY=[Yt1,Yt2,,Ytm]Tmmm

Yt=AY+ϵtYt=A[Y,X]T+ϵt.
Xti(j)Ytϵtϵt

Zt(1),,Zt(p)Z=[Zt1(1),Zt2(1),,Ztm(p)]T

Yt=A[Y,Z]T+ϵtYt=A[Y,X,Z]T+ϵt.

Este é apenas um esboço e acredito que muitos autores aprimoraram essa ideia.

cantorhead
fonte
Bem-vindo ao site, @cantorhead. Queremos que (perguntas e) respostas aqui sejam independentes. Seria melhor se você tentasse "ser mais específico aqui" e não apenas sugerisse às pessoas o Google GC.
gung - Restabelece Monica
0

Você não pode - pelo menos não dentro das estatísticas.

Máximo: você nunca pode ter certeza de que o efeito de uma variável é causado por outra. O motivo: você nunca pode saber se não há outra variável que você não está ciente e os dados que você coletou não pode possivelmente dizer.

O fato da vida é que a coleta de dados nem sempre é suficiente quando os dados são estáticos e o fenômeno é dinâmico - como o comportamento humano. Lá, a própria coleta de dados pode distorcer os resultados, assim como na física de partículas o fato da observação em si não pode ser removido da equação.

Marcos
fonte