Como a modelagem de regressão geralmente é mais "arte" do que ciência, muitas vezes me pego testando muitas iterações de uma estrutura de regressão. Quais são algumas maneiras eficientes de resumir as informações dessas várias execuções de modelo na tentativa de encontrar o "melhor" modelo? Uma abordagem que usei é colocar todos os modelos em uma lista e percorrer summary()
essa lista, mas imagino que existem maneiras mais eficientes de comparar?
Código e modelos de amostra:
ctl <- c(4.17,5.58,5.18,6.11,4.50,4.61,5.17,4.53,5.33,5.14)
trt <- c(4.81,4.17,4.41,3.59,5.87,3.83,6.03,4.89,4.32,4.69)
group <- gl(2,10,20, labels=c("Ctl","Trt"))
weight <- c(ctl, trt)
lm1 <- lm(weight ~ group)
lm2 <- lm(weight ~ group - 1)
lm3 <- lm(log(weight) ~ group - 1)
#Draw comparisions between models 1 - 3?
models <- list(lm1, lm2, lm3)
lapply(models, summary)
r
regression
correr atrás
fonte
fonte
Respostas:
Traçá-los!
http://svn.cluelessresearch.com/tables2graphs/longley.png
Ou, se necessário, use tabelas: O pacote apsrtable ou a
mtable
função no pacote memisc .Usando
mtable
fonte
grid
, nãolattice
:)memisc
anteriormente, parece um pacote muito útil para se ter na aljava!O seguinte não responde exatamente à pergunta. Pode dar algumas idéias, no entanto. Recentemente, fiz algo para avaliar o ajuste de vários modelos de regressão usando uma a quatro variáveis independentes (a variável dependente estava na primeira coluna do quadro de dados df1).
O conteúdo de as.character (formlist) foi
Então eu coletei alguns índices úteis
O quadro de dados final foi
Finalmente, um gráfico de Cp (usando a biblioteca wle)
fonte