Eu tenho um modelo GLM logístico com 8 variáveis. Fiz um teste do qui-quadrado em R anova(glm.model,test='Chisq')
e 2 das variáveis se mostraram preditivas quando ordenadas no início do teste e não tanto quando ordenadas na parte inferior. O summary(glm.model)
sugere que os seus coeficientes são insignificantes (elevado valor de p). Nesse caso, parece que as variáveis não são significativas.
Eu queria perguntar qual é o melhor teste de significância das variáveis - a significância do coeficiente no resumo do modelo ou no teste do qui-quadrado anova()
. Além disso - quando um é melhor sobre o outro?
Eu acho que é uma pergunta ampla, mas qualquer sugestão sobre o que considerar será apreciada.
Respostas:
Além da resposta do @ gung, tentarei fornecer um exemplo do que a
anova
função realmente testa. Espero que isso permita que você decida quais testes são adequados para as hipóteses que você está interessado em testar.my.mod <- glm(y~x1+x2+x3, family="binomial")
anova(my.mod, test="Chisq")
glm(y~1, family="binomial")
vs.glm(y~x1, family="binomial")
glm(y~x1, family="binomial")
vs.glm(y~x1+x2, family="binomial")
glm(y~x1+x2, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
Portanto, ele compara sequencialmente o modelo menor com o próximo modelo mais complexo, adicionando uma variável em cada etapa. Cada uma dessas comparações é feita por meio de um teste de razão de verossimilhança (teste LR; veja o exemplo abaixo). Que eu saiba, essas hipóteses raramente são de interesse, mas isso deve ser decidido por você.
Aqui está um exemplo em
R
:summary(my.mod)
x1
:glm(y~x2+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x2
:glm(y~x1+x3, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
x3
:glm(y~x1+x2, family="binomial")
vs.glm(y~x1+x2+x3, family="binomial")
Portanto, cada coeficiente em relação ao modelo completo contém todos os coeficientes. Os testes de Wald são uma aproximação do teste da razão de verossimilhança. Também poderíamos fazer os testes de razão de verossimilhança (teste LR). Aqui está como:
summary(my.mod)
rank
anova(my.mod, test="Chisq")
rank
anova(mod1.2, my.mod, test="Chisq")
rank
fonte
test="Chisq"
, quando você não estiver executando um teste de razão de verossimilhança, precisará definirtest="LRT"
isso, consulte ? Anova.glm .test="LRT"
etest="Chisq"
são sinônimos (está indicado na página que você vinculou).test="LRT"
é melhor, pois fica imediatamente claro que é um teste de razão de verossimilhança. Eu mudei isso. Obrigado.7.088e-05, 0.01419, 00.03684
) devem ser interpretados?