O que significam interações de termos spline e não spline?

10

Se eu ajustar meus dados com algo como lm(y~a*b), na sintaxe R, onde aé uma variável binária e buma variável numérica, o a:btermo de interação é a diferença entre a inclinação de y~bat a= 0 e at a= 1.

Agora, digamos que a relação entre ye bé curvilínea. Se agora eu me encaixo lm(y~a*poly(b,2)), então a:poly(b,2)1é a mudança na mudança de y~bcondicional no nível aacima, e a:poly(b,2)2é a mudança no y~b^2condicional no nível de a. É preciso um pouco de ondulação manual, mas se qualquer um desses coeficientes de interação for significativamente diferente de zero, posso argumentar que isso significa aafeta não apenas o deslocamento vertical, ymas também a localização do pico e a inclinação da aproximação ao pico da y~b+b^2curva.

E se eu me encaixar lm(y~a*bs(b,df=3))? Como posso interpretar os a:bs(b,df=3)1, a:bs(b,df=3)2e a:bs(b,df=3)3termos? Esses deslocamentos verticais ydo spline são atribuíveis a acada um dos três segmentos?

f1r3br4nd
fonte

Respostas:

7

+1 para uma pergunta boa e claramente definida. (Se você queria um pouco mais de informação sobre polinômios e estrias, você pode encontrar este útil, embora parece que você tem uma forte compreensão do tema.) Você também pode querer ler estepergunta recente sobre a interpretação dos termos que governam a curvatura da relação entre uma variável covariável e uma resposta. Você notará que eu argumento contra interpretações separadas para os diferentes termos, mas é melhor tratá-las como gestais. (No entanto, para não seguir uma linha muito dura, reconheço que você pode calcular a localização do ápice da parábola a partir dos betas do modelo de regressão, como você observa aqui.) Consistente com a minha resposta anterior, acho melhor interpretar todos os termos associados à mesma variável subjacente juntos. Com relação a esse caso específico, a interação simplesmente estabelece que a forma das curvas difere entre os dois níveis de fator a.

- Reinstate Monica
fonte