Regressão moderada: Por que calculamos um termo * produto * entre os preditores?

12

As análises de regressão moderada são frequentemente usadas nas ciências sociais para avaliar a interação entre dois ou mais preditores / covariáveis.

Normalmente, com duas variáveis ​​preditoras, o seguinte modelo é aplicado:

Y=β0+β1X+β2M+β3XM+e

Observe que o teste de moderação é operacionalizado pelo termo do produto (a multiplicação entre a variável independente X e a variável moderadora M ). Minha pergunta fundamental é: por que realmente calculamos um termo de produto entre X e M ? Por que não, por exemplo, a diferença absoluta | MX | ou apenas a soma X + M ?X M X M | M - X | X + MXMXMXM|MX|X+M

Curiosamente, Kenny faz alusão a esta questão aqui http://davidakenny.net/cm/moderation.htm dizendo: "Como será visto, o teste de moderação nem sempre é operacionalizado pelo termo XM do produto", mas nenhuma explicação adicional é fornecida . Uma ilustração ou prova formal seria esclarecedora, eu acho / espero.

denominador
fonte

Respostas:

12

Um "moderador" afeta os coeficientes de regressão de contra X : eles podem mudar à medida que os valores do moderador mudam. Assim, em plena generalidade, o modelo simples de regressão da moderação éYX

E(Y)=α(M)+β(M)X

onde e β são funções do moderador M em vez de constantes não afectadas por valores de M .αβMM

No mesmo espírito em que a regressão se baseia em uma aproximação linear da relação entre e Y , podemos esperar que α e β sejam - pelo menos aproximadamente - funções lineares de M ao longo da faixa de valores de M no dados:XYαβMM

E(Y)=α0+α1M+O(M2)+(β0+β1M+O(M2))X=α0+β0X+α1M+β1MX+O(M2)+O(M2)X.

Descartar os termos não lineares ("big-O"), na esperança de que sejam pequenos demais para importar, fornece o modelo de interação multiplicativo (bilinear)

(1)E(Y)=α0+β0X+α1M+β1MX.

Essa derivação sugere uma interessante interpretação dos coeficientes: é a taxa na qual M altera a interceptação enquanto β 1 é a taxa na qual M altera a inclinação . ( α 0 e β 0 são a inclinação e interceptam quando M é (formalmente) definido como zero.) β 1α1Mβ1Mα0β0Mβ1 é o coeficiente de o "termo de produto" . Responde à pergunta desta maneira:MX

Modelamos a moderação com um termo de produto quando esperamos que o moderador M tenha (aproximadamente, em média) uma relação linear com a inclinação de YMXMY vs .X


Interessante é que essa derivação aponta o caminho para uma extensão natural do modelo, o que pode sugerir maneiras de verificar a qualidade do ajuste. Se você não está preocupado com a não linearidade em conhece ou assume esse modeloX- você ( 1 ) é preciso -, você deseja estender o modelo para acomodar os termos que foram descartados:(1)

E(Y)=α0+β0X+α1M+β1MX+α2M2+β2M2X.

Testar a hipótese avalia a qualidade do ajuste. A estimativa de α 2 e β 2 pode indicar de que maneira o modelo ( 1 ) pode precisar ser estendido: incorporar a não linearidade em M (quando α 20 ) ou uma relação moderadora mais complicada (quando β 20 ) ou possivelmente ambos. (Observe que este teste não seria sugerido pela expansão de uma série de potências de uma função genérica f ( X ,α2=β2=0α2β2(1)Mα20β20 .)f(X,M)


Por fim, se você descobrir que o coeficiente de interação não é significativamente diferente de zero, mas que o ajuste é não linear (como evidenciado por um valor significativo de β 2 ), você conclui (a) que há moderação, mas ( b) não é modelado por um termo M X , mas por alguns termos de ordem superior começando com M 2 Xβ1β2MXM2X . Esse pode ser o tipo de fenômeno ao qual Kenny estava se referindo.

whuber
fonte
8

Se você usar a soma dos preditores para modelar a interação deles, sua equação seria:

Y=β0+β1X+β2M+β3(X+M)+e=β0+β1X+β2M+β3X+β3M+e=β0+(β1+β3)X+(β2+β3)M+e=β0+β1X+β2M+e

onde e β 2 = β 2 + β 3 . Portanto, seu modelo não teria nenhuma interação. Claramente, este não é o caso do produto.β1=β1+β3β2=β2+β3

Lembre-se da definição do valor absoluto:

|XM|={XM,XMMX,X<M

Embora você possa reduzir o modelo àquele com apenas termos X e M , usando o def. de | X - M | , o valor absoluto é uma "forma especializada de moderação que dificilmente será realista em muitas situações", conforme apontado no comentário abaixo.β0+β1X+β2M+β3|XM|+eXM|XM|

Milos
fonte
1
Na verdade, incluindo um o termo é comprovadamente uma forma de moderação: o valor de M muda β 2 . É, no entanto, uma forma limitada e especializada de moderação que dificilmente será realista em muitas situações. Não é correto dizer que esse modelo tem "apenas efeitos principais". |XM|Mβ2
whuber
1
Sim, você está certo, é uma forma de moderação, me empolguei com a transformação e editarei a resposta de acordo. Obrigado por apontar isso. |XM|
Milos
@Milos: Seu exemplo sobre a soma de preditores foi algo que abriu os olhos, um tanto embaraçoso, devo dizer, porque eu já deveria ter percebido as implicações matemáticas;) whuber: Pelo que entendi, o valor absoluto só é útil quando as duas variáveis ​​preditoras são medidas nas mesmas unidades (por exemplo, dois testes psicométricos, usando a mesma métrica, como escores z ou escores T). A diferença absoluta entre X e M é uma métrica útil , embora não seja a única possível (ou seja, o termo prodcut também pode ser usado).
denominador
6

f(X,M)

f(X,M)=f(0,0)+f(0,0)TT+f(0,0)MM+2f(0,0)TMTM+2f(0,0)2T2T2+2f(0,0)2M2M2

If you plug a function of this form f(X,M)=β0+βXX+βMM+βXMXM into the Taylor equation, you get this:

f(X,M)=β0+βXX+βMM+βXMXM

So, the rationale here is that this particular multiplicative form of the moderation is basically a second order Taylor approximation of a generic moderation relationship f(X,M)

UPDATE: if you include quadratic terms, as @whuber suggested then this will happen:

g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2
plug this into Taylor:
g(X,M)=b0+bXX+bMM+bXMXM+bX2X2+bM2M2

This shows that our new model g(X,M) with quadratic terms corresponds to a full second order Taylor approximation, unlike the original moderation model f(X,M).

Aksakal
fonte
Since the basis of your argument is the Taylor expansion, why did you not also include the other two quadratic terms X2 and M2? True, they are not forms of moderation, but their inclusion in the model usually will affect βXM.
whuber
@whuber, I decided to keep the post short - that's the main reason. Otherwise, I started writing about my preference to include second order terms whenever you have a cross term, then cut it out.
Aksakal