Se eu ajustar meus dados com algo como lm(y~a*b)
, na sintaxe R, onde a
é uma variável binária e b
uma variável numérica, o a:b
termo de interação é a diferença entre a inclinação de y~b
at a
= 0 e at a
= 1.
Agora, digamos que a relação entre y
e b
é curvilínea. Se agora eu me encaixo lm(y~a*poly(b,2))
, então a:poly(b,2)1
é a mudança na mudança de y~b
condicional no nível a
acima, e a:poly(b,2)2
é a mudança no y~b^2
condicional no nível de a
. É preciso um pouco de ondulação manual, mas se qualquer um desses coeficientes de interação for significativamente diferente de zero, posso argumentar que isso significa a
afeta não apenas o deslocamento vertical, y
mas também a localização do pico e a inclinação da aproximação ao pico da y~b+b^2
curva.
E se eu me encaixar lm(y~a*bs(b,df=3))
? Como posso interpretar os a:bs(b,df=3)1
, a:bs(b,df=3)2
e a:bs(b,df=3)3
termos? Esses deslocamentos verticais y
do spline são atribuíveis a a
cada um dos três segmentos?
fonte