Estou usando R e tenho analisado meus dados com GLM com link Binomial.
Quero saber qual é o significado da interceptação na tabela de saída. A interceptação para um dos meus modelos é significativamente diferente, mas a variável não é. O que isto significa?
Qual é a interceptação? Não sei se estou apenas me confundindo, mas tendo pesquisado na internet, não há nada a dizer, é isso, tome nota ... ou não.
Por favor, ajudem, um aluno muito frustrado
glm(formula = attacked_excluding_app ~ treatment, family = binomial,
data = data)
Deviance Residuals:
Min 1Q Median 3Q Max
-2.3548 0.3593 0.3593 0.3593 0.3593
Coefficients:
Estimate Std. Error z value Pr(>|z|)
(Intercept) 2.708 1.033 2.622 0.00874 **
treatmentshiny_non-shiny 0.000 1.461 0.000 1.00000
(Dispersion parameter for binomial family taken to be 1)
Null deviance: 14.963 on 31 degrees of freedom
Residual deviance: 14.963 on 30 degrees of freedom
(15 observations deleted due to missingness)
AIC: 18.963
Number of Fisher Scoring iterations: 5
r
generalized-linear-model
Samuel Waldron
fonte
fonte
Respostas:
O termo intercepto é o intercepto na parte linear da equação GLM, portanto, seu modelo para a média é , em que é sua função de link e é seu modelo linear. Este modelo linear contém um "termo de interceptação", ou seja:g X βE[ Y] = g- 1( X β) g X β
No seu caso, a interceptação é significativamente diferente de zero, mas a variável não, então está dizendo que
Como sua função de link é binomial, então
E assim, com apenas o termo de interceptação, seu modelo ajustado para a média é:
Você pode ver que se , isso corresponde a uma chance de 50:50 de obter Y = 1 ou 0, ou seja,E [ Y ] = 1c = 0 E[ Y] = 11 + 1= 0,5
Portanto, seu resultado está dizendo que você não pode prever o resultado, mas uma classe (1 ou 0) é mais provável que a outra.
fonte
Parece-me que pode haver algum problema com os dados. É estranho que a estimativa de parâmetro para o coeficiente seja 0,000. Parece que seu DV e seu IV são dicotômicos e que as proporções do seu DV não variam de maneira alguma com o seu IV. Isto está certo?
A interceptação, como observei no meu comentário (e como a resposta de @corone implica) é o valor do DV quando o IV é 0. Como o seu IV foi codificado? No entanto, o fato de a estimativa do coeficiente ser de 0,000 implica que o IV não faz diferença.
Portanto, a interceptação de 2.708 é o logit estimado do DV: ou seja, em todos os níveis do IV.log ( p1 - p)
fonte
No seu caso, a interceptação é a média geral
attacked_excluding_app
calculada para todos os dados, independentemente detreatment
. O teste de significância na tabela de coeficientes está testando se é significativamente diferente de zero. Se isso é relevante depende se você tem algum motivo a priori para esperar que seja zero ou não.Por exemplo, imagine que você testou um medicamento e um placebo quanto ao efeito na pressão arterial. Para cada sujeito, você registra a alteração na pressão sanguínea calculando (pressão após tratamento - pressão antes do tratamento) e a trata como a variável dependente em sua análise. Você então descobre que o efeito do tratamento (medicamento versus placebo) não é significativo, mas que a interceptação é significativamente maior que 0 - isso indica que, em média, a pressão sanguínea de seus pacientes aumentou entre os dois tempos de medição. Isso pode ser interessante e precisa de mais investigação.
fonte