Preciso de uma explicação de uma frase sobre o uso da AIC na construção de modelos. Até agora, eu disse "Simplificando, a AIC é uma medida relativa da quantidade de variação observada contabilizada por diferentes modelos e permite a correção da complexidade do modelo".
Qualquer conselho muito apreciado.
R
The AIC is a measure of how well a model fits a dataset, penalizing models that are so flexible that they would also fit unrelated datasets just as well.
Aqui está uma definição que localiza a AIC no zoológico de técnicas usadas para a seleção de modelos. A AIC é apenas uma das várias maneiras razoáveis de capturar a troca entre qualidade de ajuste (que é aprimorada adicionando complexidade do modelo na forma de variáveis explicativas extras ou acrescentando advertências como "mas apenas na quinta-feira, quando chove") e parcimônia (mais simples == melhor) na comparação de modelos não aninhados. Aqui está a cópia fina:
fonte
E se:
Se isso for muito longe na direção não técnica, deixe-me saber nos comentários e eu vou apresentar outro.
fonte
AIC é uma medida de quão bem os dados são explicados pelo modelo corrigido pela complexidade do modelo.
fonte
O outro lado da excelente resposta da @ gung:
O AIC é um número que mede o quão bem um modelo se ajusta a um conjunto de dados, em uma escala móvel que exige que modelos mais elaborados sejam significativamente mais precisos para obter uma classificação mais alta.EDITAR:
O AIC é um número que mede o quão bem um modelo se ajusta a um conjunto de dados, em uma escala móvel que requer modelos significativamente mais elaborados ou flexíveis para serem significativamente mais precisos.
fonte
Seja k o número de parâmetros de um modelo e MaxL seja o valor da função de probabilidade no máximo. Em seguida, o Critério de informação de Akaike é definido comoAIC=2k−2ln(MaxL) . O objetivo é encontrar um modelo que minimize a AIC.
Dada essa definição, a AIC é um critério usado para escolher o modelo que produz o melhor compromisso entre a escarsidade no número de parâmetros e a probabilidade máxima para a estimativa desses parâmetros.
fonte