Eu tenho a seguinte saída:
Generalized linear mixed model fit by the Laplace approximation
Formula: aph.remain ~ sMFS2 +sAG2 +sSHDI2 +sbare +season +crop +(1|landscape)
AIC BIC logLik deviance
4062 4093 -2022 4044
Random effects:
Groups Name Variance Std.Dev.
landscape (Intercept) 0.82453 0.90804
Number of obs: 239, groups: landscape, 45
Fixed effects:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.65120 0.14051 18.868 <2e-16
sMFS2 0.26922 0.17594 1.530 0.1260
sAG2 0.09268 0.14529 0.638 0.5235
sSHDI2 0.28345 0.17177 1.650 0.0989
sbare 0.41388 0.02976 13.907 <2e-16
seasonlate -0.50165 0.02729 -18.384 <2e-16
cropforage 0.79000 0.06724 11.748 <2e-16
cropsoy 0.76507 0.04920 15.551 <2e-16
Correlation of Fixed Effects:
(Intr) sMFS2 sAG2 sSHDI2 sbare sesnlt crpfrg
sMFS2 -0.016
sAG2 0.006 -0.342
sSHDI2 -0.025 0.588 -0.169
sbare -0.113 -0.002 0.010 0.004
seasonlate -0.034 0.005 -0.004 0.001 -0.283
cropforage -0.161 -0.005 0.012 -0.004 0.791 -0.231
cropsoy -0.175 -0.022 0.013 0.013 0.404 -0.164 0.557
Todas as minhas variáveis contínuas (indicadas por um pequeno s
antes do nome da variável) são padronizadas (z-scores). season
é uma variável categórica com 2 níveis (precoce e tardio) e crop
é uma variável categórica com 3 níveis (milho, forragem e soja).
Essa correlação da matriz de efeitos fixos está realmente me confundindo, porque todas as correlações têm o sinal oposto ao que ocorre quando observo as simples regressões de pares de variáveis. isto é, a matriz de correlação de efeitos fixos sugere uma forte correlação positiva entre cropforage
e sbare
, quando, de fato, existe uma correlação NEGATIVA muito forte entre essas variáveis - as culturas forrageiras tendem a ter muito menos solo descoberto em comparação com as culturas de milho e soja. Pares de variáveis contínuas têm o mesmo problema, a matriz de correlação de efeitos fixos diz que tudo é o oposto do que deveria ser ... Isso poderia ser devido à complexidade do modelo (não sendo uma simples regressão)? Poderia ter algo a ver com o fato de as variáveis serem padronizadas?
Obrigado.
Se suas correlações negativas e positivas são iguais em seu valor e apenas seu sinal é diferente, você está inserindo a variável por engano. Mas não acho que esse seja o seu caso, pois você já parece bastante avançado nas estatísticas.
A inconsistência que você está enfrentando pode ser e provavelmente é causada por multicolinearidade. Significa quando algumas variáveis independentes compartilham alguns efeitos sobrepostos ou, em outras palavras, são correlacionadas . por exemplo, modelar as variáveis "taxa de crescimento" e "tamanho do tumor" pode causar multicolinearidade, pois é possível e provável que tumores maiores tenham maiores taxas de crescimento (antes de serem detectados) per se. Isso pode confundir o modelo. E se o seu modelo tiver poucas variáveis independentes correlacionadas entre si, interpretar os resultados às vezes pode se tornar bastante difícil. Às vezes, leva a coeficientes totalmente estranhos, mesmo a tal extensão que o sinal de algumas das correlações se inverte.
Você deve primeiro detectar as fontes da multicolinearidade e lidar com elas e, em seguida, executar novamente sua análise.
fonte
Pode ser útil mostrar que essas correlações entre efeitos fixos são obtidas convertendo o "vcov" do modelo em uma matriz de correlação. Se
fit
é o seu modelo lme4 instalado,e as correlações entre efeitos fixos são as entradas fora da diagonal.
fonte