No "Livro do Porquê" da Judea Pearl, ele fala sobre o que chama de Escada da Causação, que é essencialmente uma hierarquia composta por diferentes níveis de raciocínio causal. O mais baixo diz respeito aos padrões de associação nos dados observados (por exemplo, correlação, probabilidade condicional etc.), o próximo se concentra na intervenção (o que acontece se alterarmos deliberadamente o processo de geração de dados de alguma maneira pré-especificada?), E o terceiro é contrafactual (o que aconteceria em outro mundo possível se algo tivesse ou não acontecido)?
O que não estou entendendo é como os degraus dois e três diferem. Se fizermos uma pergunta contrafactual, não estamos simplesmente fazendo uma pergunta sobre a intervenção, a fim de negar algum aspecto do mundo observado?
Respostas:
Não há contradição entre o mundo factual e a ação de interesse no nível intervencionista. Por exemplo, fumar até hoje e ser forçado a parar de fumar a partir de amanhã não está em contradição entre si, mesmo que você possa dizer que um "nega" o outro. Mas agora imagine o seguinte cenário. Você conhece Joe, um fumante vitalício que tem câncer de pulmão, e se pergunta: e se Joe não fumasse há trinta anos, ele estaria saudável hoje? Nesse caso, estamos lidando com a mesma pessoa, ao mesmo tempo, imaginando um cenário em que ação e resultado estão em contradição direta com fatos conhecidos.
Assim, a principal diferença de intervenções e contrafatuais é que, enquanto nas intervenções você está perguntando o que acontecerá em média se realizar uma ação, em contrafatuais você está perguntando o que teria acontecido se você tivesse tomado um curso de ação diferente em uma situação específica , desde que você tenha informações sobre o que realmente aconteceu. Observe que, como você já sabe o que aconteceu no mundo real, é necessário atualizar suas informações sobre o passado à luz das evidências que observou.
Esses dois tipos de consultas são matematicamente distintos porque exigem que níveis diferentes de informações sejam respondidos (contrafatuais precisam de mais informações para serem respondidas) e uma linguagem ainda mais elaborada para serem articuladas !.
Com as informações necessárias para responder às perguntas do Rung 3, você pode responder às perguntas do Rung 2, mas não o contrário. Mais precisamente, você não pode responder perguntas contra-factuais apenas com informações de intervenção. Exemplos em que ocorre o choque de intervenções e contrafactuais já foram dados aqui no CV, veja este post e este post . No entanto, por uma questão de exaustividade, incluirei um exemplo aqui também.
O exemplo abaixo pode ser encontrado na causalidade, seção 1.4.4.
Esta pergunta não pode ser respondida apenas com os dados de intervenção que você possui. A prova é simples: posso criar dois modelos causais diferentes que terão as mesmas distribuições intervencionistas, mas distribuições contrafactuais diferentes. Os dois são fornecidos abaixo:
Observe que, no primeiro modelo, ninguém é afetado pelo tratamento, portanto, a porcentagem de pacientes que morreram sob tratamento que teriam se recuperado se não tivessem feito o tratamento é zero.
No entanto, no segundo modelo, todo paciente é afetado pelo tratamento, e temos uma mistura de duas populações nas quais o efeito causal médio acaba sendo zero. Neste exemplo, a quantidade contrafactual agora é de 100% - no Modelo 2, todos os pacientes que morreram sob tratamento teriam se recuperado se não tivessem feito o tratamento.
Portanto, há uma clara distinção entre a linha 2 e a linha 3. Como o exemplo mostra, você não pode responder perguntas contrafactuais apenas com informações e suposições sobre intervenções. Isso fica claro com as três etapas para calcular um contrafactual:
Não será possível calcular sem algumas informações funcionais sobre o modelo causal ou sem algumas informações sobre variáveis latentes.
fonte
Aqui está a resposta que Judea Pearl deu no twitter :
fonte