Em R, se eu chamar a lm()
função da seguinte maneira:
lm.1 = lm(response ~ var1 + var2 + var1 * var2)
summary(lm.1)
Isso me dá um modelo linear da variável resposta com var1
, var2
e a interação entre eles. No entanto, como exatamente interpretamos numericamente o termo de interação?
A documentação diz que este é o "cruzamento" entre var1
e var2
, mas não deu uma explicação do que exatamente é o "cruzamento".
Seria útil saber quais números exatos R está calculando para incorporar a interação entre as duas variáveis.
r
regression
Enzo
fonte
fonte
var3 <- var 1 * var2
, em seguida, construirlm.2 <- lm(response ~ var1 + var2 + var3)
var1
evar2
contínua (na minha opinião, é bastante contínua) ou se um deles é, por exemplo, categórico binário (mais fácil de considerar.) Veja esta resposta para alguns exemplos de interpretação de Peter Flom: stats.stackexchange.com/a/45512/16974Respostas:
A maneira padrão de escrever a equação de previsão para o seu modelo é:
Mas entender a interação é um pouco mais fácil se considerarmos isso de maneira diferente:
Predict.Plot
TkPredict
fonte
lm
Era isso que você queria?
fonte
É mais fácil pensar em interações em termos de variáveis discretas. Talvez você possa ter estudado ANOVAs bidirecionais, onde temos duas variáveis de agrupamento (por exemplo, sexo e categoria etária, com três níveis de idade) e está analisando como elas pertencem a alguma medida contínua (nossa variável dependente, por exemplo, QI).
O termo x1 * x2, se significativo, pode ser entendido (neste exemplo trivial e inventado) como QI se comportando de maneira diferente nos diferentes níveis de idade para os diferentes sexos. Por exemplo, talvez o QI seja estável para homens nos três grupos etários, mas as mulheres jovens começam abaixo dos homens jovens e têm uma trajetória ascendente (com o grupo de idade avançada tendo uma média mais alta que o grupo de idade masculina). Em um gráfico de médias, isso implicaria uma linha horizontal para machos no meio do gráfico e talvez uma linha de 45 graus para fêmeas que começa abaixo dos machos, mas termina acima dos machos.
A essência é que, à medida que você se move pelos níveis de uma variável (ou "mantendo X1 constante"), o que está acontecendo nas outras variáveis muda. Essa interpretação também funciona com variáveis preditivas contínuas, mas não é tão fácil ilustrar concretamente. Nesse caso, convém pegar valores específicos de X1 e X2 e ver o que acontece com Y.
fonte