Qual seria uma imagem ilustrativa para modelos lineares mistos?

17

Diga que você está na biblioteca do seu departamento de estatística e se depara com um livro com a figura a seguir na primeira página.

insira a descrição da imagem aqui

Você provavelmente pensará que este é um livro sobre coisas de regressão linear.

Qual seria a imagem que faria você pensar em modelos lineares mistos?

ocram
fonte

Respostas:

12

Para uma palestra, usei a figura a seguir, baseada no sleepstudyconjunto de dados do pacote lme4 . A idéia era ilustrar a diferença entre ajustes de regressão independentes de dados específicos de sujeitos (cinza) versus previsões de modelos de efeitos aleatórios, especialmente que (1) os valores previstos do modelo de efeitos aleatórios são estimadores de encolhimento e que (2) trajetórias de indivíduos compartilham uma inclinação comum com um modelo somente de interceptação aleatória (laranja). As distribuições de interceptações de sujeitos são mostradas como estimativas de densidade de kernel no eixo y ( código R ).

insira a descrição da imagem aqui
(As curvas de densidade se estendem além da faixa de valores observados porque há relativamente poucas observações.)

Um gráfico mais "convencional" pode ser o próximo, que é de Doug Bates (disponível no site R-forge para lme4 , por exemplo, 4Longitudinal.R ), onde podemos adicionar dados individuais em cada painel.

insira a descrição da imagem aqui

chl
fonte
+1. Um bom! Eu acho que seu primeiro enredo é ótimo em um nível conceitual. Meu único comentário seria que ele requer significativamente mais explicações do que um enredo "ingênuo" padrão e, se o público não estiver de acordo com os conceitos de modelos LME e dados longitudinais, ele poderá perder o objetivo do enredo. Definitivamente vou lembrar para uma sólida "conversa sobre estatísticas". (Eu já vi o segundo enredo no livro "lme4" algumas vezes. Eu não estava muito impressionado e também não estou muito impressionado agora.)
usεr11852 diz Reinstate Monic
@chl: Obrigado! Eu vou escolher entre as propostas. Enquanto isso, +1
ocram 03/03
@ user11852 Meu entendimento do modelo de RI é que as estimativas do OLS estão corretas, mas seus erros padrão não são (devido à falta de independência), de modo que as previsões individuais também estarão incorretas. Normalmente, eu mostraria a linha de regressão geral assumindo observações independentes. Então, a teoria nos diz que a combinação de modos condicionais dos efeitos aleatórios e estimativas dos efeitos fixos produz modos condicionais dos coeficientes dentro do sujeito, e haverá pouco skrinkage quando as unidades estatísticas forem diferentes, ou quando as medições forem precisas ou com grandes amostras.
chl
@chi: Eu concordo, como mencionei originalmente toda a idéia de usar "agrupamentos" é exatamente porque alguém originalmente identifica "grupos de heterocedasticidade nos resíduos de um gráfico de OLS". (Então, para ter praticamente ou incondicionalmentey|γN(Xβ+Zγ,σ2Eu)yN(Xβ,ZDZT+σ2Eu)
usεr11852 diz Reinstate Monic 03/03
O link para o código R para criar a imagem está quebrado. Eu estaria interessado em desenhar as distribuições verticalmente na figura.
Niels Hameleers
8

Então, algo não "extremamente elegante", mas mostrando interceptações aleatórias e inclinações também com R. (acho que seria ainda mais legal se mostrassem as equações reais também) insira a descrição da imagem aqui

N =100; set.seed(123);


x1 = runif(N)*3; readings1 <- 2*x1 + 1.0 + rnorm(N)*.99;
x2 = runif(N)*3; readings2 <- 3*x2 + 1.5 + rnorm(N)*.99;
x3 = runif(N)*3; readings3 <- 4*x3 + 2.0 + rnorm(N)*.99;
x4 = runif(N)*3; readings4 <- 5*x4 + 2.5 + rnorm(N)*.99;
x5 = runif(N)*3; readings5 <- 6*x5 + 3.0 + rnorm(N)*.99;

X = c(x1,x2,x3,x4,x5);
Y = c(readings1,readings2,readings3,readings4,readings5)
Grouping  = c(rep(1,N),rep(2,N),rep(3,N),rep(4,N),rep(5,N))

library(lme4);
LMERFIT <- lmer(Y ~ 1+ X+ (X|Grouping))

RIaS <-unlist( ranef(LMERFIT)) #Random Intercepts and Slopes
FixedEff <- fixef(LMERFIT)    # Fixed Intercept and Slope

png('SampleLMERFIT_withRandomSlopes_and_Intercepts.png', width=800,height=450,units="px" )
par(mfrow=c(1,2))
plot(X,Y,xlab="x",ylab="readings")
plot(x1,readings1, xlim=c(0,3), ylim=c(min(Y)-1,max(Y)+1), pch=16,xlab="x",ylab="readings" )
points(x2,readings2, col='red', pch=16)
points(x3,readings3, col='green', pch=16)
points(x4,readings4, col='blue', pch=16)
points(x5,readings5, col='orange', pch=16)
abline(v=(seq(-1,4 ,1)), col="lightgray", lty="dotted");        
abline(h=(seq( -1,25 ,1)), col="lightgray", lty="dotted")   

lines(x1,FixedEff[1]+ (RIaS[6] + FixedEff[2])* x1+ RIaS[1], col='black')
lines(x2,FixedEff[1]+ (RIaS[7] + FixedEff[2])* x2+ RIaS[2], col='red')
lines(x3,FixedEff[1]+ (RIaS[8] + FixedEff[2])* x3+ RIaS[3], col='green')
lines(x4,FixedEff[1]+ (RIaS[9] + FixedEff[2])* x4+ RIaS[4], col='blue')
lines(x5,FixedEff[1]+ (RIaS[10]+ FixedEff[2])* x5+ RIaS[5], col='orange') 
legend(0, 24, c("Group1","Group2","Group3","Group4","Group5" ), lty=c(1,1), col=c('black','red', 'green','blue','orange'))
dev.off()
usεr11852 diz Reinstate Monic
fonte
Obrigado! Espero um pouco mais por novas respostas em potencial ... mas posso aproveitar essa.
Ocram
Estou um pouco confuso com sua figura, porque a subtrama correta me parece como se uma linha de regressão separada fosse adequada para cada grupo. Não é o ponto principal que os ajustes mistos do modelo devem ser diferentes dos ajustes independentes por grupo? Talvez eles estejam, mas neste exemplo é realmente difícil perceber, ou estou perdendo alguma coisa?
ameba diz Restabelecer Monica
2
Sim, o coeficiente é diferente . Não; uma regressão separada não foi adequada para cada grupo. Os ajustes condicionais são mostrados. Em um projeto homosquástico perfeitamente equilibrado como esse, a diferença será difícil de notar, por exemplo, a interceptação condicional do grupo 5 é de 2,96 enquanto a interceptação independente por grupo é de 3,00. É a estrutura de covariância de erro que você está alterando. Verifique a resposta do chi também, ele tem mais grupos, mas mesmo em poucos casos o ajuste é "muito diferente" visualmente.
usεr11852 diz Reinstate Monic
6

Não é meu trabalho

Este gráfico, extraído da documentação do nlmefit do Matlab, me parece um exemplo real do conceito de interceptações e inclinações aleatórias. Provavelmente algo mostrando grupos de heterocedasticidade nos resíduos de um gráfico OLS também seria bastante padrão, mas eu não daria uma "solução".

usεr11852 diz Reinstate Monic
fonte
Obrigado por sua sugestão. Embora pareça coisas de regressão logística mista, acho que posso adaptá-lo facilmente. Espero por mais sugestões. Enquanto isso, +1. Obrigado novamente.
Ocram 02/03
Parece uma regressão logística mista principalmente porque é uma ... :) Foi a primeira trama que me veio à mente! Vou dar algo puramente R-ish em uma segunda resposta.
usεr11852 diz Reinstate Monic 02/02