Assintoticamente, minimizar o AIC é equivalente a minimizar o MSE de validação cruzada de exclusão única para dados transversais [ 1 ]. Então, quando temos a AIC, por que alguém usa o método de dividir os dados em conjuntos de treinamento, validação e teste para medir as propriedades preditivas dos modelos? Quais são especificamente os benefícios dessa prática?
Posso pensar em uma razão: se alguém deseja avaliar o desempenho preditivo dos modelos, a análise fora da amostra é útil. Mas, embora a AIC não seja uma medida da precisão da previsão , geralmente se tem uma boa idéia se algum modelo estiver atingindo seu potencial máximo (para os dados que lhe são fornecidos) em termos de quão bem você será capaz de prever.
predictive-models
aic
Erosennin
fonte
fonte
Respostas:
Na prática, eu sempre uso validação cruzada ou uma simples divisão de teste de trem em vez de AIC (ou BIC). Não estou muito familiarizado com a teoria por trás da AIC, mas duas preocupações principais me levam a preferir estimativas mais diretas de precisão preditiva:
O número em si não diz muito sobre a precisão de um modelo. A AIC pode fornecer evidências de qual dos vários modelos é o mais preciso, mas não informa a precisão do modelo em unidades do DV. Quase sempre estou interessado em estimativas de precisão concretas desse tipo, porque ele me diz o quão útil é um modelo em termos absolutos e também o quão mais preciso é do que um modelo de comparação.
O AIC, como o BIC, precisa para cada modelo uma contagem de parâmetros ou algum outro valor que mede a complexidade do modelo. Não está claro o que você deve fazer para isso no caso de métodos preditivos menos tradicionais, como a classificação do vizinho mais próximo, florestas aleatórias ou o novo método maluco que você rabiscou em um guardanapo no meio do caminho do mês passado. Por outro lado, estimativas de precisão podem ser produzidas para qualquer modelo preditivo e da mesma maneira.
fonte