Teste o modelo GLM usando desvios nulos e do modelo

11

Eu construí um modelo de glm em R e o testei usando um grupo de teste e treinamento, por isso estou confiante de que funciona bem. Os resultados de R são:

Coefficients:
                            Estimate Std. Error  t value Pr(>|t|)    
(Intercept)               -2.781e+00  1.677e-02 -165.789  < 2e-16 ***
Coeff_A                    1.663e-05  5.438e-06    3.059  0.00222 ** 
log(Coeff_B)               8.925e-01  1.023e-02   87.245  < 2e-16 ***
log(Coeff_C)              -3.978e-01  7.695e-03  -51.689  < 2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

(Dispersion parameter for quasibinomial family taken to be 0.9995149)

    Null deviance: 256600  on 671266  degrees of freedom
Residual deviance: 237230  on 671263  degrees of freedom
AIC: NA

Todos os valores de p para os coeficientes são pequenos conforme o esperado.

Olhando para esta pergunta ( Interpretando o desvio residual e o nulo no GLM R ), eu deveria ser capaz de calcular se a hipótese nula é válida usando a seguinte equação:

p-value = 1 - pchisq(deviance, degrees of freedom)

Colocar isso em dá:

1 - pchisq(256600, 671266)
[1] 1

Então, estou correto ao pensar que a hipótese nula não pode ser rejeitada aqui, mesmo que os valores de p para todos os coeficientes sejam tão pequenos ou tenha interpretado mal como calcular isso?

Zfunk
fonte

Respostas:

18

Há um mal-entendido aqui. A diferença entre o desvio nulo e o desvio do modelo é distribuída como um qui-quadrado com graus de liberdade iguais ao df nulo menos o df do modelo. Para o seu modelo, isso seria:

1-pchisq(256600 - 237230, df=(671266 - 671263))
# [1] 0

pchisq()lower.tail = FALSE1

Repor a Monica
fonte
2
Qual hipótese exatamente você está testando com a afirmação 1-pchisq(256600 - 237230, df=(671266 - 671263))?
jii
5
@ jesterII, você está verificando se o desvio mudou mais do que o esperado por acaso. Ou seja, você está testando se o modelo como um todo é melhor que o modelo nulo. É análogo ao teste F global em um modelo linear.
gung - Restabelece Monica
A hipótese nula é 'o modelo como um todo é melhor que o modelo nulo' e você rejeitou a hipótese nula, o que significa que o modelo é ruim?
jii
3
@ jesterII, não, a hipótese nula é: 'o modelo como um todo não é melhor que o modelo nulo'. Como isso foi rejeitado, concluímos que os dados não são consistentes com o modelo nulo. NB, isso não significa necessariamente que nosso modelo seja 'bom' ou 'correto'.
gung - Restabelece Monica