Suponha que eu esteja interessado em um modelo de regressão linear, para , porque gostaria de ver se uma interação entre as duas covariáveis afeta Y.
Nas anotações do curso de um professor (com quem não tenho contato), ele declara: Ao incluir termos de interação, você deve incluir os termos de segundo grau. ie deve ser incluído na regressão.
Por que devemos incluir termos de segundo grau quando estamos interessados apenas nas interações?
Respostas:
Depende do objetivo da inferência. Se você deseja inferir se existe uma interação, por exemplo, em um contexto causal (ou, de maneira mais geral, se você deseja interpretar o coeficiente de interação), essa recomendação do seu professor faz sentido e vem do fato de que a especificação incorreta da forma funcional pode levar a inferências erradas sobre a interação .
Aqui está um exemplo simples em que não há termo de interação entre e na equação estrutural de ; no entanto, se você não incluir o termo quadrático de , concluiria erroneamente que interage com quando, na verdade, não ' t.x1 x2 y x1 x1 x2
Isso pode ser interpretado como simplesmente um caso de viés de variável omitida, e aqui é a variável omitida. Se você voltar e incluir o termo quadrado em sua regressão, a interação aparente desaparecerá.x21
Certamente, esse raciocínio se aplica não apenas a termos quadráticos, mas a especificação incorreta da forma funcional em geral. O objetivo aqui é modelar a função de expectativa condicional adequadamente para avaliar a interação. Se você estiver se limitando à modelagem com regressão linear, precisará incluir esses termos não lineares manualmente. Mas uma alternativa é usar modelagem de regressão mais flexível, como a regressão de crista do kernel, por exemplo.
fonte
rm(list=ls())
no código postado aqui! Se as pessoas simplesmente copiarem e colarem e executarem o código, poderão ter uma surpresa ... Eu o removi por enquanto.Os dois modelos que você listou em sua resposta podem ser reexpressos para deixar claro como o efeito de é postulado para depender de (ou o contrário) em cada modelo.X1 X2
O primeiro modelo pode ser reexpresso assim:
que mostra que, neste modelo, é assumido como tendo um efeito linear em (controlando o efeito de ), mas a magnitude desse efeito linear - capturada pelo coeficiente de inclinação de - muda linearmente em função de . Por exemplo, o efeito de em pode aumentar em magnitude à medida que os valores de aumentam.X1 Y X2 X1 X2 X1 Y X2
O segundo modelo pode ser reexpresso assim:
o que mostra que, nesse modelo, o efeito de em (controlando o efeito de ) é assumido como quadrático, e não linear. Esse efeito quadrático é capturado pela inclusão de e no modelo. Enquanto o coeficiente de é considerado independente de , o coeficiente de é considerado como linearmente dependente de .X1 Y X2 X1 X21 X21 X2 X1 X2
O uso de qualquer um dos modelos implicaria que você está fazendo suposições completamente diferentes sobre a natureza do efeito de em (controlando o efeito de ).X1 Y X2
Geralmente, as pessoas se encaixam no primeiro modelo. Eles podem plotar os resíduos desse modelo contra e em turnos. Se os resíduos revelarem um padrão quadrático nos resíduos em função de e / ou , o modelo poderá ser aumentado de acordo para incluir e / ou (e possivelmente a interação deles).X1 X2 X1 X2 X21 X22
Observe que simplifiquei a notação usada para consistência e também expliquei o termo de erro nos dois modelos.
fonte