Em um comentário à resposta desta pergunta , foi afirmado que o uso de AIC na seleção de modelos era equivalente a usar um valor-p de 0,154.
Eu tentei em R, onde usei um algoritmo de seleção de subconjunto "para trás" para descartar variáveis de uma especificação completa. Primeiro, jogando fora a variável com o mais alto valor de p e interrompendo quando todos os valores de p estão abaixo de 0,154 e, em segundo lugar, removendo a variável que resulta em menor AIC quando removida até que nenhuma melhoria possa ser feita.
Acontece que eles fornecem aproximadamente os mesmos resultados quando eu uso um valor p de 0,154 como limite.
Isso é realmente verdade? Se sim, alguém sabe por que ou pode se referir a uma fonte que explica isso?
PS: Eu não poderia perguntar à pessoa comentando ou escrever um comentário, porque acabei de me inscrever. Estou ciente de que essa não é a abordagem mais adequada para seleção e inferência de modelos, etc.
fonte
Respostas:
A seleção de variáveis feita usando testes estatísticos ou AIC é altamente problemática. Se estiver usando , o AIC usa um ponto de corte de = 2.0 que corresponde a . AIC quando usado em variáveis individuais não faz nada de novo; apenas usa um mais razoável que 0,05. Um mais razoável (menos perturbador de inferência) é 0,5.χ2 χ2 α = 0,157 α α
fonte