Qual é o valor p crítico usado pelo step()
função em R para regressão passo a passo? Presumo que seja 0,15, mas minha suposição está correta? Como posso alterar o valor p crítico?
r
regression
p-value
stepwise-regression
Jason Samuels
fonte
fonte
Description
parte da página de ajuda?step
diz, na sua totalidade: Selecione um modelo baseado em fórmula da AIC.Respostas:
Como expliquei no meu comentário sobre sua outra pergunta,
step
usa AIC em vez de valores-p.No entanto, para uma única variável de cada vez, AIC faz correspondem ao uso de um valor de p de 0,15 (ou para ser mais preciso, 0,1573):
Considere comparar dois modelos, que diferem por uma única variável. Chame os modelos (modelo menor) e M 1 (modelo maior) e deixe seus AICs serem AIC 0 e AIC 1M0 M1 AIC0 0 AIC1 respectivamente.
Usando o critério AIC, você usaria o modelo maior se . Este será o caso se - 2 log L 0 - ( - 2 log L 1 ) > 2 .AIC1< AIC0 0 - 2 logeu0 0- ( - 2 logeu1) > 2
Mas isso é simplesmente a estatística em um teste de razão de verossimilhança. A partir do teorema de Wilks, rejeitaremos o nulo se a estatística exceder o quantil superior de um χ 2 1 . Portanto, se usarmos um teste de hipótese para escolher entre o modelo menor e o maior, escolheremos o modelo maior quando - 2 log L 0 - ( - 2 log L 1 ) > C α .α χ21 −2logL0−(−2logL1)>Cα
Agora está no percentil 84,27 de um χ 2 1 . Portanto, se escolhermos o modelo maior quando tiver um AIC menor, isso corresponderá à rejeição da hipótese nula para um teste do termo adicional com um valor de p de 1 - 0,843 = 0,157 , ou 15,7 %2 χ21 1−0.843=0.157 15.7%
Então, como você o modifica?
Fácil. Altere o
k
parâmetrostep
de 2 para outra coisa. Você quer 10% em seu lugar? Faça 2.7:Você quer 2,5%? Conjunto
k=5
:e assim por diante.
No entanto, mesmo que isso resolva sua pergunta, recomendo que você preste muita atenção à resposta de Frank Harrell em sua outra pergunta, e procure respostas de muitos estatísticos sobre outras questões relacionadas à regressão passo a passo aqui, conselho esse que tende a ser muito consistentemente para evitar procedimentos passo a passo em geral.
fonte
Como dito acima, a
step
função em R é baseada nos critérios da AIC. Mas acho que com valor-p você quer dizer alfa para entrar e alfa para sair. O que você pode fazer é usar a funçãostepwise
escrita por Paul Rubin e disponível aqui . Como você pode ver, você tem os argumentos de alpha.to.enter e alpha.to.leave que você pode alterar. Observe que esta função usa o teste F ou teste t equivalente para selecionar os modelos. Além disso, ele pode lidar não apenas com a regressão por etapas, mas também com a seleção direta e a eliminação retroativa, se você definir os argumentos adequadamente.fonte