Histórico: Nota: Meu conjunto de dados e código-r estão incluídos abaixo do texto
Desejo usar o AIC para comparar dois modelos de efeitos mistos gerados usando o pacote lme4 em R. Cada modelo tem um efeito fixo e um efeito aleatório. O efeito fixo difere entre os modelos, mas o efeito aleatório permanece o mesmo entre os modelos. Descobri que se eu usar REML = T, o modelo2 tem a pontuação mais baixa na AIC, mas se eu usar REML = F, o modelo1 tem a pontuação mais baixa na AIC.
Suporte para o uso de ML:
Zuur et al. (2009; PÁGINA 122) sugerem que "Para comparar modelos com efeitos fixos aninhados (mas com a mesma estrutura aleatória), a estimativa de ML deve ser usada e não a REML". Isso indica para mim que devo usar o ML, pois meus efeitos aleatórios são os mesmos nos dois modelos, mas meus efeitos fixos diferem. [Zuur et al. 2009. Modelos de efeitos mistos e extensões em ecologia com R. Springer.]
Suporte para usar REML:
No entanto, percebo que, quando uso ML, a variação residual associada aos efeitos aleatórios difere entre os dois modelos (modelo1 = 136,3; modelo2 = 112,9), mas quando uso REML, é a mesma entre os modelos (modelo1 = modelo2 = 151,5). Isso implica para mim que eu deveria usar REML para que a variação residual aleatória permaneça a mesma entre modelos com a mesma variável aleatória.
Questão:
Não faz mais sentido usar REML do que ML para comparações de modelos em que os efeitos fixos mudam e os efeitos aleatórios permanecem os mesmos? Caso contrário, você pode explicar por que ou me apontar para outra literatura que explica mais?
# Model2 "wins" if REML=T:
REMLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = T)
REMLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = T)
AIC(REMLmodel1,REMLmodel2)
summary(REMLmodel1)
summary(REMLmodel2)
# Model1 "wins" if REML=F:
MLmodel1 = lmer(Response ~ Fixed1 + (1|Random1),data,REML = F)
MLmodel2 = lmer(Response ~ Fixed2 + (1|Random1),data,REML = F)
AIC(MLmodel1,MLmodel2)
summary(MLmodel1)
summary(MLmodel2)
Conjunto de dados:
Response Fixed1 Fixed2 Random1
5.20 A A 1
32.50 A A 1
6.57 A A 2
24.77 A B 3
41.69 A B 3
34.29 A B 4
1.80 A B 4
10.00 A B 5
15.56 A B 5
4.44 A C 6
21.65 A C 6
9.20 A C 7
4.11 A C 7
12.52 B D 8
0.25 B D 8
27.34 B D 9
11.54 B E 10
0.86 B E 10
0.68 B E 11
4.00 B E 11
Respostas:
Zuur et al. E Faraway (do comentário de @ janhove acima) estão certos; o uso de métodos baseados em verossimilhança (incluindo AIC) para comparar dois modelos com diferentes efeitos fixos ajustados pelo REML geralmente levará a um absurdo.
fonte
Vou dar um exemplo para ilustrar por que a probabilidade REML não pode ser usada para coisas como comparações da AIC. Imagine que temos um modelo normal de efeitos mistos. Deixe denotar a matriz de design e suponha que essa matriz tenha classificação completa. Podemos encontrar uma reparametrização do valor médio do espaço, dada pela matriz . As duas matrizes abrangem o mesmo subespaço linear de . Assim, as colunas de pode ser escrito como combinações lineares das colunas de . Portanto, podemos encontrar uma matriz quadrática, , tal queX X~ Rn X~ X B
Além disso, tem classificação completa (isso pode ser comprovado assumindo que não; então também não seria uma contradição). Isso significa que é invertível.B X B
Se começarmos a usar a segunda parametrização do espaço de valor médio e deixar ser uma matriz de covariância, vamos considerar o critério REML que devemos maximizar (estou omitindo uma constante)V
sobre o conjunto de parâmetros, em que . Usando o fato de que , podemos perceber que isso pode ser reescrito comoβ= ( X~V- 1X~)- 1y X= X~B
onde . Essa é a probabilidade de REML para os outros tempos de parametrização o determinante de.| B|β¯= ( XV- 1X)- 1y | B |
Portanto, temos um exemplo de duas parametrizações diferentes do mesmo modelo, fornecendo diferentes valores de probabilidade, assumindo que (essa matriz pode ser facilmente encontrada). O mesmo valor de parâmetro maximizará o critério nos dois casos, mas o valor da probabilidade será diferente. Isso mostra que existe um elemento arbitrário no valor da probabilidade e, portanto, ilustra por que não se pode usar o valor da probabilidade para comparação entre modelos com diferentes efeitos fixos: você seria capaz de alterar os resultados simplesmente alterando a parametrização do espaço de valor médio em um dos modelos.| B | ≠ 1
Este é um exemplo de por que o REML não deve ser usado ao comparar modelos com diferentes efeitos fixos. REML, no entanto, muitas vezes estima melhor os parâmetros de efeitos aleatórios e, portanto, às vezes é recomendável usar ML para comparações e REML para estimar um modelo único (talvez final).
fonte