Comparando Modelos Não Aninhados com AIC

19

Digamos que precisamos dos GLMMs

mod1 <- glmer(y ~ x + A + (1|g), data = dat)
mod2 <- glmer(y ~ x + B + (1|g), data = dat)

Esses modelos não são aninhados no sentido usual de:

a <- glmer(y ~ x + A + (1|g),     data = dat)
b <- glmer(y ~ x + A + B + (1|g), data = dat)

então não podemos fazer anova(mod1, mod2)o que faríamos anova(a ,b).

Podemos usar a AIC para dizer qual é o melhor modelo?

user1322296
fonte

Respostas:

24

O AIC pode ser aplicado com modelos não aninhados. De fato, este é um dos mitos mais extensos (mal-entendidos?) Sobre a AIC. Vejo:

É preciso ter cuidado com a inclusão de todas as constantes de normalização, pois elas são diferentes para os diferentes modelos (não aninhados):

Veja também:

No contexto do GLMM, uma pergunta mais delicada é a confiabilidade da AIC para comparar esse tipo de modelo (consulte também o @ BenBolker). Outras versões da AIC são discutidas e comparadas no seguinte artigo:

Lustre
fonte
2
nota que o marginal vs. condicional distinção AIC é mais importante quando se tenta comparar modelos que diferem em seus conjuntos de efeitos aleatórios
Ben Bolker
@ Chandelier & Ben Bolker, muito obrigado pelas duas respostas. Algum de vocês tem uma referência mais formal para o argumento de usar a AIC dessa maneira?
user1322296
2
@ user1322296 Eu sugiro ir à raiz, este é o artigo de Akaike . O AIC é obtido como um estimador da divergência entre o seu modelo e o "modelo verdadeiro". Portanto, nenhum assentamento assumido, apenas algumas condições de regularidade.
27414 Chandelier
Portanto, é válido comparar a AIC de lm1 = x ~ A + B C e lm2 = x ~ D + B C, por exemplo? Graças
crazjo
Parece haver modelos não aninhados para os quais o uso da AIC não é apropriado. Aqui estão dois exemplos: 1 e 2 . Você poderia fornecer algumas condições sob as quais a seleção de modelos não aninhados funciona?
1130 Carl
10

Para referência, um contra-argumento: Brian Ripley afirma em "Seleção entre grandes classes de modelos", pp. 6-7

Pressupostos cruciais ... Os modelos estão aninhados (nota de rodapé: veja a parte inferior da página 615 na reimpressão de Akaike (1973)). - AIC é amplamente utilizado quando não está

f(x|kθ

Ripley, BD 2004. “Selecionando entre Grandes Classes de Modelos.” ​​Em Métodos e Modelos em Estatística , editado por N. Adams, M. Crowder, D.J. Hand e D. Stephens, 155–70. Londres, Inglaterra: Imperial College Press.

Akaike, H. (1973) Teoria da informação e uma extensão do princípio da máxima verossimilhança. No Segundo Simpósio Internacional sobre Teoria da Informação (Eds BN Petrov e F. Cáski), pp. 267–281, Budapeste. Akademiai Kaidó. Reimpresso em Breakthroughs in Statistics , eds Kotz, S. & Johnson, NL (1992), volume I, pp. 599–624. Nova York: Springer.

Ben Bolker
fonte
3

Parece que Akaike achou que o AIC era uma ferramenta útil para comparar modelos não aninhados.

"Uma observação importante sobre o AIC é que ele é definido sem referência específica ao modelo verdadeiro [f (x | kθ)]. Assim, para qualquer número finito de modelos paramétricos, podemos sempre considerar um modelo estendido que desempenhará o papel de [f (x | kθ)] Isso sugere que o AIC pode ser útil, pelo menos em princípio, para a comparação de modelos que não são aninhados, ou seja, a situação em que o teste convencional de razão de verossimilhança logarítmica não é aplicável. "

(Akaike 1985, pág. 399)

Akaike, Hirotugu. "Previsão e entropia." Papéis selecionados de Hirotugu Akaike. Springer, Nova Iorque, NY, 1985. 387-410.

JonesBC
fonte