REML vs ML stepAIC

10

Sinto-me impressionado depois de tentar pesquisar na literatura sobre como executar minha análise de modelo misto, seguindo-a com o uso da AIC para selecionar o melhor modelo ou modelos. Não acho que meus dados sejam tão complicados, mas estou procurando uma confirmação de que o que fiz foi correto e depois aconselho sobre como proceder. Não tenho certeza se devo usar lme ou lmer e, em seguida, com qualquer um deles, se devo usar REML ou ML.

Eu tenho um valor de seleção e quero saber quais covariáveis ​​melhor influenciam esse valor e permitem previsões. Aqui estão alguns dados de exemplo compostos e meu código para o meu teste com o qual estou trabalhando:

ID=as.character(rep(1:5,3))
season=c("s","w","w","s","s","s","s","w","w","w","s","w","s","w","w")
time=c("n","d","d","n","d","d","n","n","n","n","n","n","d","d","d")
repro=as.character(rep(1:3,5))
risk=runif(15, min=0, max=1.1)
comp1=rnorm(15, mean = 0, sd = 1)
mydata=data.frame(ID, season, time, repro, risk, comp1)
c1.mod1<-lmer(comp1~1+(1|ID),REML=T,data=mydata)
c1.mod2<-lmer(comp1~risk+(1|ID),REML=T,data=mydata)
c1.mod3<-lmer(comp1~season+(1|ID),REML=T,data=mydata)
c1.mod4<-lmer(comp1~repro+(1|ID),REML=T,data=mydata)
c1.mod5<-lmer(comp1~time+(1|ID),REML=T,data=mydata)
c1.mod6<-lmer(comp1~season+repro+time+(1|ID),REML=T,data=mydata)
c1.mod7<-lmer(comp1~risk+season+season*time+(1|ID),REML=T,data=mydata)

Eu tenho ~ 19 modelos que exploram esses dados com várias combinações e termos de interação de duas vias, mas sempre com ID como efeito aleatório e comp1 como variável dependente.

  • Q1 Qual usar? lme ou lmer? isso importa?

Em ambos, tenho a opção de usar ML ou REML - e recebo respostas drasticamente diferentes - usando ML seguido de AIC, termino com 6 modelos, todos com valores similares de AIC e as combinações de modelos simplesmente não fazem sentido, enquanto REML resulta em dois dos modelos mais prováveis ​​sendo os melhores. No entanto, ao executar o REML, não posso mais usar o anova.

  • Q2 é o principal motivo para usar ML sobre REML por causa do uso com ANOVA? Isso não está claro para mim.

Ainda não consigo executar o stepAIC ou não conheço outra maneira de restringir esses 19 modelos.

  • Q3 existe uma maneira de usar stepAIC neste momento?
Kerry
fonte
3
Para Q2, ML é necessário porque comparações usando REML não são válidas quando os efeitos fixos são alterados. Uma possível pergunta relacionada é útil: stats.stackexchange.com/a/16015/3601
Aaron deixou o Stack Overflow em
@ Aaron Eu já tinha olhado para essa pergunta antes, mas ainda estava confuso. Usar REML apenas "funciona" quando o efeito aleatório muda? Obviamente, eu não entendo o suficiente de ML vs REML. Obrigado, porém, que ajuda com uma das minhas perguntas!
Kerry
Sim, está correto. Ao comparar modelos, o REML deve ser usado apenas se os modelos tiverem os mesmos efeitos fixos. Resposta expandida abaixo.
Aaron saiu de Stack Overflow

Respostas:

16

Q1 Qual usar? lme ou lmer? isso importa? Qualquer um está bom. Eles lhe darão os mesmos ajustes. lmevai lhe dar valores p, e lmernão vai, mas é mais do que eu quero entrar aqui. A referência mais famosa é uma das postagens de Doug Bates na lista de discussão R-help aqui .

(ressalva: eles usam ligeiramente diferentes algoritmos de forma que há casos potencialmente alguns computacionalmente difíceis onde um ou outro pode fazer melhor, mas esses são muito raros na prática, e na verdade, o ponto mais provável que algum tipo de modelo misspecification Veja. Completamente diferente resultados de lmer () e lme () .)

Q2 é o principal motivo para usar ML sobre REML por causa do uso com ANOVA? Isso não está claro para mim. ML é necessário porque comparações usando REML não são válidas quando os efeitos fixos são alterados. Uma possível questão relacionada e útil está aqui: https://stats.stackexchange.com/a/16015/3601 . Para responder à sua pergunta no comentário acima, sim, ao comparar modelos, o REML deve ser usado apenas se os modelos tiverem os mesmos efeitos fixos (ou seja, quando apenas os efeitos aleatórios mudarem). A probabilidade de REML depende de quais efeitos fixos estão no modelo e, portanto, não são comparáveis ​​se os efeitos fixos mudarem. No entanto, geralmente considera-se que o REML fornece melhores estimativas para os efeitos aleatórios; portanto, o conselho usual é ajustar seu melhor modelo usando o REML para sua inferência e relatório finais.

Q3 existe uma maneira de usar stepAIC neste momento? Para comparar seus 19 modelos que fazem sentido na sua situação, basta comparar o AIC para todos eles. Não há razão para usar um procedimento passo a passo. Os procedimentos passo a passo são geralmente vistos como antiquados hoje em dia, pois não garantem que o melhor modelo seja encontrado, e os computadores facilitam a comparação de muitos modelos.

Aaron deixou Stack Overflow
fonte
1

Em pesquisas adicionais, também encontrei esses recursos que fazem backup dos links que Aaron forneceu e são boas leituras para aqueles que estão começando como eu. Os capítulos vinculados em http://lme4.r-forge.r-project.org/ para obter exemplos, consulte o link dos slides http://lme4.r-forge.r-project.org/slides/ na mesma página do projeto . Muitos dos cursos de curta duração ainda têm código R de exemplo, o que foi uma grande ajuda.
Também esta resposta curta do Dr. Bolker http://r.789695.n4.nabble.com/lme-vs-lmer-how-do-they-differ-td2534332.html

Kerry
fonte