Que interpretação têm os parâmetros de um modelo linear generalizado com codificação de efeitos?

9
library(lme4)
    out <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.sum"))

summary(out)
Fixed effects:
            Estimate Std. Error z value Pr(>|z|)
(Intercept) -2.32337    0.22129 -10.499  < 2e-16 ***
period1      0.92498    0.18330   5.046 4.51e-07 ***
period2     -0.06698    0.22845  -0.293    0.769
period3     -0.20326    0.24193  -0.840    0.401

Eu nunca estava em uma situação em que precisava ajustar um modelo linear generalizado com codificação de efeito ( contr.sumpara Rusuários). Posso aplicar a mesma interpretação que no caso do modelo linear? Em um modelo linear normal, a intercepção seria a grande média e o s (parâmetros para , , e os efeitos, isto é, como os níveis dos factores desviar-se da média geral.βperiod1period2period3period4 = (Intercept) - period1 - period2 - period3

Aqui está como eu acho que a interpretação análoga para modelos lineares generalizados ocorre. (Vou exponenciar todos os parâmetros e, portanto, transformar as probabilidades de log (-ratios) em probabilidades (-ratios).) A interceptação seria então as chances gerais de sucesso versus falha ( seguindo a terminologia binomial clássica) e os são os log-odds-ratios . E temos as probabilidades de, por exemplo , adicionando e depois exponenciando: . As realmente as probabilidades gerais / médias e as sβ (interceptação) + período1 exp ( (interceptação) + período1 ) (interceptação) βexp((Intercept))βperiod1(Intercept)+period1exp((Intercept)+period1)(Intercept)βodds ratio ?

lord.garbage
fonte

Respostas:

3

Na codificação de efeitos, a interceptação no resumo da tabela de resumo (saída) é o logit médio (log-odds ou o log of odds ratio) em todos os quatro períodos do seu caso, e cada um dos outros efeitos é a diferença logit do período correspondente em relação ao logit médio.

Você pode verificar facilmente sua interpretação comparando os resultados atuais com um método de codificação diferente, como codificação fictícia em seus dados:

out2 <- glmer(cbind(incidence, size - incidence)
                 ~ period
                 + (1 | herd),
                 data = cbpp,
                 family = binomial,
                 contrasts = list(period = "contr.treatment"))

summary(out2)
pólo azul
fonte
1
Eu argumentaria que a interceptação não é uma razão de chances, mas sim as probabilidades médias e apenas os coeficientes ( 's) são razões de chances . O fornece as probabilidades médias (após exponenciação) e quando você adiciona a razão de chances de log de, por exemplo, às probabilidades de log de e exponencia essa soma. você tem chances de . Eu acho que é importante realmente manter odds-ratios e odds separados. O primeiro é uma razão entre as probabilidades, e as chances de sucesso versus fracasso (em um modelo binomial).(Intercepto) período1 (Intercepto) período1β(Intercept)period1(Intercept)period1
lord.garbage
Pet seu comentário, eu editei minha resposta um pouco. Veja se está melhor agora.
bluepole