Se o Hosmer-Lemeshow indicar uma falta de ajuste, mas o AIC for o mais baixo entre todos os modelos ... você ainda deve usar o modelo?
Se eu excluir uma variável, a estatística Hosmer-Lemeshow não é significativa (o que significa que não há falta grave de ajuste). Mas a AIC aumenta.
Edit : Eu acho que em geral, se os AICs de modelos diferentes são próximos (ou seja, ) um do outro, então eles são basicamente os mesmos. Mas os AICs são muito diferentes. Isso parece indicar que aquele com o AIC mais baixo é o que devo usar, embora o teste Hosmer-Lemeshow indique o contrário.
Talvez também o teste HL se aplique apenas a amostras grandes? Possui baixa potência para amostras pequenas (meu tamanho é ~ 300). Mas se estou obtendo um resultado significativo ... Isso significa que, mesmo com pouca energia, estou recebendo uma rejeição.
Faria diferença se eu usasse o AICc versus o AIC? Como você obtém AICc's no SAS? Eu sei que pode haver problemas com a multiplicidade. Mas, a priori , suponho que as variáveis tenham efeito sobre o resultado.
Algum comentário?
Edit2 : Eu acho que devo usar o modelo com uma variável a menos e o AIC mais alto com HL não significativo. O motivo é que duas das variáveis estão correlacionadas entre si. Então, se livrar de um faz sentido.
Respostas:
O teste de Hosmer-Lemeshow é, até certo ponto, obsoleto, porque exige o armazenamento arbitrário de probabilidades previstas e não possui poder excelente para detectar falta de calibração. Também não penaliza totalmente o ajuste excessivo do modelo. Melhores métodos estão disponíveis, como Hosmer, DW; Hosmer, T.; le Cessie, S. & Lemeshow, S. Uma comparação dos testes de qualidade do ajuste para o modelo de regressão logística. Statistics in Medicine , 1997, 16 , 965-980. Sua nova medida é implementada no RR2 c
rms
fonte
rms
pacote R. E evite comparar a AIC de muitos modelos, que é apenas outra maneira de usar