Ao usar o comando drop1 em R para construção de modelo, é dito que a variável com o menor valor de AIC deve ser descartada. Qual poderia ser a razão para o mesmo? Eu sei que a AIC fala sobre perda de informações e um valor mais baixo da AIC é melhor, mas soltar uma variável com AIC baixa parece contra-intuitivo. Alguém pode explicar o motivo de fazê-lo?
r
regression
aic
Jash Shah
fonte
fonte
Respostas:
O AIC fornecido
drop1
refere-se a todo o modelo - não a uma variável; portanto, a saída informa qual variável remover para gerar o modelo com o AIC mais baixo. Por exemplo, com o conjunto de dados internoswiss
Aqui, a remoção de
Examination
produzirá o modelo com a AIC mais baixaEm uma nota relacionada, embora possa ser melhor usar AIC do que valores de p, é considerado uma prática ruim usar qualquer algoritmo de seleção automática de modelo: Algoritmos para seleção automática de modelo
fonte
pchisq(2,1,lower.tail=FALSE)
); corresponderá a um valor-p de teste z bicaudal (pnorm(sqrt(2),lower.tail=FALSE)*2
) e, a menos que o df seja razoavelmente pequeno, também se aproximará de um corte do valor-p do teste t ou do teste F (acima de 40 df é 16% para a porcentagem inteira mais próxima para qualquer df)