Depois de mostrarmos que duas quantidades estão correlacionadas, como inferimos que o relacionamento é causal? E, além disso, qual causa o quê? Agora, em teoria, pode-se usar uma "atribuição aleatória" (seja qual for a palavra certa), para quebrar qualquer vínculo de acidente que possa existir entre duas variáveis. Mas, em alguns casos, isso não é possível. Por exemplo, considere a frequência com que uma pessoa fuma, medida em cigarros por semana, versus a expectativa de vida, medida em anos. Podemos escolher aleatoriamente dois grupos de pessoas. Faça um grupo fumar e o outro não. Como a tarefa é aleatória, isso deve interromper qualquer outra relação entre eles. Mas é claro que isso não é possível por muitas razões diferentes. Então, quais são algumas das técnicas que podem ser usadas?
fonte
Respostas:
Eu acho que essa é uma pergunta muito boa. Encontro esse problema frequentemente e reflito muito sobre ele. Eu pesquiso em ciências médicas e a noção em medicina é que nada é provado causal, nunca, nunca, nunca, até que um ensaio clínico randomizado controlado, de preferência com uma pílula (ou qualquer outra exposição que possa ser tripla), tenha provado um efeito na resposta de interesse. Isso é bastante triste, pois todos os outros estudos são considerados estudos de associação, que tendem a reduzir seu impacto.
Hill e Richard Doll pensaram sobre isso. O primeiro formulou os critérios de Hill para causalidade:
Isso foi formulado há cerca de 50 anos, antes do advento de estudos randomizados (que podem não ser do seu interesse), mas é digno de nota que os experimentos não tiveram um papel crucial nos critérios de Hill.
Eu gostaria de pensar que os dados observacionais, se analisados com métodos estatísticos adequados, permitem inferências de causalidade. (É claro que isso depende de muitos fatores.) Mas, no meu campo, quando se trata de mudar o gerenciamento de pacientes, é raro ver diretrizes moldadas por algo que não seja ensaios clínicos randomizados e o prelúdio de diretrizes frequentemente enfatiza que certa causalidade só pode ser obtido em ensaios randomizados.
Agora eu sei que muitos de vocês não vão concordar comigo. Também não concordo comigo. Mas isso pode aumentar a discussão.
fonte
O Statistics fornece ferramentas para detectar e modelar regularidades nos dados. O processo de modelagem geralmente é guiado pelo conhecimento do assunto. Quando o modelo representa o mecanismo do objeto, as propriedades estatísticas do modelo estimado informam se os dados estão em desacordo com o mecanismo modelado. Em seguida, a causalidade (ou a falta dela) é inferida - e isso é feito no domínio do objeto .
Um exemplo: suponha que você tenha uma amostra aleatória de duas variáveis e . A correlação entre eles é grande e estatisticamente significativa.yx y
Até agora, você pode dizer se causa ? Acho que não.yx y
fonte
Atualmente, a pergunta assume que as quantidades estão correlacionadas, o que implica que a pessoa que determina a correlação deve ter boas razões para acreditar que as variáveis compartilham um relacionamento linear.
A causalidade de Granger pode ser a melhor ferramenta para determinar relações causais lineares. Granger foi um economista que compartilhou um prêmio nobel por seu trabalho sobre Causação linear.
Este é apenas um esboço e acredito que muitos autores aprimoraram essa ideia.
fonte
Você não pode - pelo menos não dentro das estatísticas.
Máximo: você nunca pode ter certeza de que o efeito de uma variável é causado por outra. O motivo: você nunca pode saber se não há outra variável que você não está ciente e os dados que você coletou não pode possivelmente dizer.
O fato da vida é que a coleta de dados nem sempre é suficiente quando os dados são estáticos e o fenômeno é dinâmico - como o comportamento humano. Lá, a própria coleta de dados pode distorcer os resultados, assim como na física de partículas o fato da observação em si não pode ser removido da equação.
fonte