Há um parágrafo sobre interações no The Book of Why (Pearl & Mackenzie, 2018), capítulo 9 (não consigo compartilhar o número da página porque tenho o livro no formato epub), onde os autores argumentam que:
No entanto, a Equação 9.4 se mantém automaticamente em uma situação, sem a necessidade aparente de invocar contrafactuais. É o caso de um modelo causal linear, do tipo que vimos no Capítulo 8. Como discutido lá, os modelos lineares não permitem interações , o que pode ser uma virtude e uma desvantagem. É uma virtude no sentido de facilitar a análise da mediação, mas é uma desvantagem se queremos descrever um processo causal do mundo real que envolve interações. [Ênfase minha]
A equação 9.4 é
Eles repetiram um argumento semelhante antes no capítulo 8:
Por outro lado, os modelos lineares não podem representar curvas dose-resposta que não sejam retas. Eles não podem representar efeitos limiares, como um medicamento que tem efeitos crescentes até uma certa dose e, em seguida, nenhum efeito adicional. Eles também não podem representar interações entre variáveis . Por exemplo, um modelo linear não pode descrever uma situação em que uma variável aprimora ou inibe o efeito de outra variável. (Por exemplo, a educação pode aumentar o efeito da experiência, colocando o indivíduo em um trabalho mais rápido, com aumentos anuais maiores.) [Ênfase minha]
E no capítulo 7:
Lembre-se também de que o ajuste baseado em regressão * funciona apenas para modelos lineares, que envolvem uma suposição importante de modelagem. Com modelos lineares, perdemos a capacidade de modelar interações não lineares, como quando o efeito de X em Y depende do nível de Z. O ajuste da porta traseira, por outro lado, ainda funciona bem, mesmo quando não temos idéia do que funções estão atrás das setas nos diagramas. Mas neste caso não paramétrico, precisamos empregar outros métodos de extrapolação para lidar com a maldição da dimensionalidade. [Ênfase minha]
Por que Pearl e Mackenzie argumentam que os modelos lineares não permitem interações? Eu negligencio um detalhe importante e informações específicas do contexto?
* Por ajuste baseado em regressão, os autores se referem (nos parágrafos anteriores), ao que chamamos de "controle de" outras variáveis: "O análogo de uma linha de regressão é um plano de regressão, que possui uma equação que se parece com ... O coeficiente nos fornece o coeficiente de regressão de em já ajustado para (É chamado de coeficiente de regressão parcial e está escrito .) "
Respostas:
Você está confluindo lineares em parâmetros com lineares em variáveis. Linearidade aqui se refere à relação entre as variáveis.
O argumento deles no livro é que, se o modelo não for linear nas variáveis , nem a equação
mantém, nem o coeficiente de regressão fornece o ajuste adequado da porta traseira diretamente.
No que se refere ao último caso, por exemplo, considerar a expectativa condicional , o qual é linear em relação a e .E[Y|x,z]=βx+γz X Z
Se satisfizer o critério de backdoor para o efeito causal de em , entãoZ X Y
Ou seja, o coeficiente de regressão é igual ao efeito causal marginal médio. Isso é o que se entende por "trabalhos de ajuste baseado em regressão", neste caso, você não precisa de etapas extras aqui --- toda a média necessária para o ajuste da porta traseira é feita automaticamente por regressão.β
Agora considere a expectativa condicional . Observe que isso não é linear em relação a eE[Y|x,z]=βx+γz+δ(x×z) x z (embora seja linear nos parâmetros).
Observe neste caso seZ satisfaz o critério de backdoor para o efeito causal de X em Y , então
Ou seja, o ajuste correto da porta traseira não é fornecido pelo coeficiente de regressãoX só.
De maneira mais geral, Pearl está dizendo que se satisfizer o critério de backdoor, você poderá usar qualquer estimador não paramétrico que preferir para calcular a distribuição pós-intervenção .Z E[Y|do(x)]=E[E[Y|x,Z]]
fonte
Modelos "puramente lineares" não permitem isso. Se você deseja modelar uma interação usando um caso específico do Modelo Linear Geral (não confunda isso com um Modelo Linear Generalizado), é necessário introduzir uma variável extra artificial como o produto dos dois que interagem.
Esse novo modelo ainda é linear em relação aos seus parâmetros (é o que importa para obter os estimadores), mas não é mais linear em relação às suas variáveis (você não pode mais falar sobre uma relação linear entre regressores e alvo)
fonte