Pergunta: Do ponto de vista do estatístico (ou de um profissional), pode-se inferir a causalidade usando escores de propensão com um estudo observacional ( não um experimento )?
Por favor, não queira iniciar uma guerra de chamas ou um debate fanático.
Antecedentes: No nosso programa de doutorado em estatística, apenas abordamos a inferência causal por meio de grupos de trabalho e algumas sessões de tópicos. No entanto, existem alguns pesquisadores muito importantes em outros departamentos (por exemplo, HDFS, Sociologia) que os estão usando ativamente.
Eu já testemunhei um debate bastante acalorado sobre esse assunto. Não é minha intenção começar um aqui. Dito isto, que referências você encontrou? Que pontos de vista você tem? Por exemplo, um argumento que ouvi contra os escores de propensão como uma técnica de inferência causal é que nunca se pode inferir causalidade devido ao viés variável omitido - se você deixar de fora algo importante, interrompe a cadeia causal. Esse é um problema não resolvível?
Isenção de responsabilidade: Esta pergunta pode não ter uma resposta correta - é muito legal clicar em cw, mas pessoalmente estou muito interessada nas respostas e ficaria feliz com algumas boas referências que incluem exemplos do mundo real.
fonte
A questão parece envolver duas coisas que realmente devem ser consideradas separadamente. O primeiro é se alguém pode inferir a causalidade a partir de um estudo observacional, e nisso você pode contrastar as visões de, digamos, Pearl (2009), que argumenta que sim, desde que você possa modelar o processo adequadamente, versus a visão @propofol, que irá encontre muitos aliados em disciplinas experimentais e que possam compartilhar alguns dos pensamentos expressos em (um pouco obscuro, mas ainda assim bom) ensaio de Gerber et al (2004). Segundo, assumindo que você acha que a causalidade pode ser inferida a partir de dados observacionais, você pode se perguntar se os métodos de pontuação de propensão são úteis para isso. Os métodos de pontuação de propensão incluem várias estratégias de condicionamento, bem como a ponderação de propensão inversa. Uma boa revisão é dada por Lunceford e Davidian (2004).
Porém, um pouco de rugas: a correspondência e a ponderação do escore de propensão também são usadas na análise de experimentos randomizados quando, por exemplo, há um interesse em calcular "efeitos indiretos" e também quando há problemas de atrito ou abandono potencialmente não aleatório ( nesse caso, o que você se parece com um estudo observacional).
Referências
Gerber A, et al. 2004. "A ilusão de aprender com a pesquisa observacional". Em Shapiro I, et al., Problems and Methods in the Study of Politics , Cambridge University Press.
Lunceford JK, Davidian M. 2004. "Estratificação e ponderação via escore de propensão na estimativa dos efeitos do tratamento causal: um estudo comparativo". Statistics in Medicine 23 (19): 2937-2960.
Pearl J. 2009. Causalidade (2ª Ed.) , Cambridge University Press.
fonte
A sabedoria convencional afirma que apenas ensaios clínicos randomizados (experimentos "reais") podem identificar causalidade.
No entanto, não é tão simples assim.
Uma razão pela qual a randomização pode não ser suficiente é que, em amostras "pequenas", a lei do número grande não é "suficientemente forte" para garantir que todas e todas as diferenças sejam equilibradas. A questão é: o que é "pequeno demais" e quando começa "grande o suficiente"? Saint-Mont (2015) argumenta aqui que "grande o suficiente" pode muito bem começar aos milhares (n> 1000)!
Afinal, o objetivo é equilibrar as diferenças entre os grupos, controlar as diferenças. Portanto, mesmo em experimentos, deve-se tomar muito cuidado para equilibrar as diferenças entre os grupos. De acordo com os cálculos de Saint-Mont (2015), pode muito bem ser que, em amostras menores, pode-se obter melhores vantagens com amostras combinadas (balanceadas manualmente).
Quanto à probabilidade. Obviamente, a probabilidade nunca é capaz de dar uma resposta conclusiva - a menos que a probabilidade seja extrema (zero ou um). No entanto, na ciência, nos encontramos frequentemente confrontados com situações em que somos incapazes de fornecer uma resposta conclusiva, pois as coisas são difíceis. Daí a necessidade de probabilidade. A probabilidade nada mais é do que uma maneira de expressar nossa incerteza em uma declaração. Como tal, é semelhante à lógica; veja Briggs (2016) aqui .
Portanto, a probabilidade nos ajudará, mas não dará respostas conclusivas, sem certeza. Mas é de grande utilidade - expressar incerteza.
Observe também que a causalidade não é primariamente uma questão estatística. Suponha que dois meios diferem "significativamente". Não significa que a variável de agrupamento é a causa da diferença na variável medida? Não (não necessariamente). Não importa qual estatística específica se use - pontuação de propensão, valores de p, fatores de Bayes e assim por diante - esses métodos (praticamente) nunca são suficientes para apoiar reivindicações causais.
fonte