Temos dois modelos que usam o mesmo método para calcular a probabilidade do log e o AIC para um é menor que o outro. No entanto, aquele com a AIC mais baixa é muito mais difícil de interpretar.
Estamos com problemas para decidir se vale a pena introduzir a dificuldade e julgamos isso usando uma diferença percentual na AIC. Descobrimos que a diferença entre os dois AICs era de apenas 0,7%, com o modelo mais complicado tendo um AIC 0,7% menor.
A baixa diferença percentual entre os dois é um bom motivo para evitar o uso do modelo com a AIC mais baixa?
O percentual de diferença explica que 0,7% mais informações são perdidas no modelo menos complicado?
Os dois modelos podem ter resultados muito diferentes?
model-selection
aic
Ali Turab Lotia
fonte
fonte
Respostas:
Não se comparar os valores absolutos de dois AICs (que pode ser como , mas também ~ 1000000 ), mas considera a sua diferença : Δ i = A I C i - A I C m i n , em que A I C i é a AIC do i- ésimo modelo, e A I C m i n é a AIC mais baixa que se obtém entre o conjunto de modelos examinados (isto é, o modelo preferido). A regra geral, descrita, por exemplo, em∼100 ∼1000000
Agora, com relação aos 0,7% mencionados na questão, considere duas situações:
Portanto, dizer que a diferença entre AICs é 0,7% não fornece nenhuma informação.
O valor AIC contém constantes de escala provenientes da probabilidade logarítmica e, portanto, Δ i estão livres dessas constantes. Pode-se considerar Δ i = A I C i - A I C m i n uma transformação rescaling que as forças o melhor modelo ter A I C m i n : = 0 .L Δi Δi=AICi−AICmin AICmin:=0
A formulação da AIC penaliza o uso de um número excessivo de parâmetros, desencorajando o excesso de ajustes. Prefere modelos com menos parâmetros, desde que os outros não ofereçam um ajuste substancialmente melhor. A AIC tenta selecionar um modelo (entre os examinados) que descreva adequadamente a realidade (na forma dos dados sob exame). Isso significa que, de fato, o modelo sendo uma descrição real dos dados nunca é considerado. Observe que o AIC fornece as informações sobre qual modelo descreve melhor os dados, mas não fornece nenhuma interpretação .
Pessoalmente , eu diria que, se você tem um modelo simples e um complicado, com uma AIC muito menor, o modelo simples não é bom o suficiente. Se o modelo mais complexo é realmente muito mais complicado, mas o não é enorme (talvez Δ i < 2 , talvez Δ i < 5 - depende da situação específica), eu me ateria ao modelo mais simples se for realmente mais fácil trabalhar com ele. .Δi Δi<2 Δi<5
Além disso, você pode atribuir uma probabilidade ao ésimo modelo viai
Finalmente, em relação à fórmula da AIC:
TL; DR
fonte