A regressão passo a passo havia sido superutilizada em muitos artigos biomédicos no passado, mas isso parece estar melhorando com uma melhor educação de seus muitos problemas. Muitos revisores mais antigos ainda o solicitam. Quais são as circunstâncias em que a regressão gradual tem um papel e deve ser usada, se houver?
13
Respostas:
Não estou ciente de situações nas quais a regressão gradual seria a abordagem preferida. Pode ser bom (principalmente em sua versão step-down a partir do modelo completo) a inicialização de todo o processo stepwise em conjuntos de dados extremamente grandes comn>>p . Here n is the number of observations in an continuous outcome (or number of records with an event in survival analysis) p is the number of candidate predictors including all considered interactions - i.e. when any even small effects become very clear and it does not matter so much how your do your model building (that would mean that n would be much larger than p than by substantially more than the sometimes quoted factor of 20).
Obviamente, a razão pela qual a maioria das pessoas é tentada a fazer algo como a regressão gradual é:
Ou seja, um método como a regressão passo a passo (se tivesse boas características operacionais) seria especialmente atraente nessas situações, quando não tiver boas características operacionais.
fonte
Dois casos em que eu não objetaria ver regressão passo a passo são
Nos dois casos de uso muito importantes, você não está tão preocupado com a inferência estatística tradicional; portanto, o fato de que valores-p, etc., não são mais válidos é pouco preocupante.
Por exemplo, se um trabalho de pesquisa dissesse "Em nosso estudo piloto, usamos regressão passo a passo para encontrar três variáveis interessantes em mil. Em um estudo de acompanhamento com novos dados, mostramos que essas três variáveis interessantes estavam fortemente correlacionadas com a resultado de interesse ", eu não teria nenhum problema com o uso de regressão passo a passo. Da mesma forma, "Usamos a regressão passo a passo para criar um modelo preditivo. Esse modelo alternativo pré-formado X em nosso conjunto de dados de espera em relação ao MSE" também é ótimo comigo.
Para deixar claro, não estou dizendo que a regressão passo a passo é a melhor maneira de abordar esses problemas. Mas é fácil e pode oferecer soluções satisfatórias.
EDITAR:
Nos comentários, há uma questão de saber se o AIC passo a passo pode realmente ser útil para previsão. Aqui está uma simulação que mostra que ele está se saindo muito melhor do que a regressão linear com todas as covariáveis e quase tão bem quanto as redes elásticas com a penalidade escolhida pela validação cruzada.
Eu não aceitaria essa simulação como o final da discussão; não é muito difícil criar um cenário em que a AIC passo a passo tenha um desempenho pior. Mas realmente não é um cenário irracional, e exatamente o tipo de situação para a qual as redes elásticas são projetadas (alta correlação de covariáveis com muito poucos efeitos grandes)!
Nota:
Eu realmente não sou fã de regressão gradual por muitas, muitas razões, então me sinto um pouco estranho por ter tomado essa posição em defesa dela. Mas apenas acho importante ser preciso exatamente sobre o que não gosto.
fonte