Como interpretar a variação do efeito aleatório em um modelo misto linear generalizado

9

Em um modelo misto linear generalizado logístico (família = binomial), não sei como interpretar a variação de efeitos aleatórios:

Random effects:
 Groups   Name        Variance Std.Dev.
 HOSPITAL (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Como interpreto esse resultado numérico?

Eu tenho uma amostra de pacientes transplantados renais em um estudo multicêntrico. Eu estava testando se a probabilidade de um paciente ser tratado com um tratamento anti-hipertensivo específico é a mesma entre os centros. A proporção de pacientes tratados varia muito entre os centros, mas pode ser devido a diferenças nas características basais dos pacientes. Portanto, estimei um modelo misto linear generalizado (logístico), ajustando-se às principais características dos pacientes. Estes são os resultados:

Generalized linear mixed model fit by maximum likelihood ['glmerMod']
 Family: binomial ( logit )
Formula: HTATTO ~ AGE + SEX + BMI + INMUNOTTO + log(SCR) + log(PROTEINUR) + (1 | CENTER) 
   Data: DATOS 

     AIC      BIC   logLik deviance 
1815.888 1867.456 -898.944 1797.888 

Random effects:
 Groups   Name        Variance Std.Dev.
 CENTER (Intercept) 0.4295   0.6554  
Number of obs: 2275, groups: HOSPITAL, 14

Fixed effects:
                           Estimate Std. Error z value Pr(>|z|)    
(Intercept)               -1.804469   0.216661  -8.329  < 2e-16 ***
AGE                       -0.007282   0.004773  -1.526  0.12712    
SEXFemale                 -0.127849   0.134732  -0.949  0.34267    
BMI                        0.015358   0.014521   1.058  0.29021    
INMUNOTTOB                 0.031134   0.142988   0.218  0.82763    
INMUNOTTOC                -0.152468   0.317454  -0.480  0.63102    
log(SCR)                   0.001744   0.195482   0.009  0.99288    
log(PROTEINUR)             0.253084   0.088111   2.872  0.00407 ** 

As variáveis ​​quantitativas estão centralizadas. Eu sei que o desvio padrão entre inter-hospitais da interceptação é 0,6554, na escala log-odds. Como a interceptação é -1,804469, na escala log-odds, a probabilidade de ser tratado com o anti-hipertensivo de um homem, com idade média, com valor médio em todas as variáveis ​​e tratamento imunológico A, para um centro "médio", é 14,1% . E agora começa a interpretação: sob a suposição de que os efeitos aleatórios seguem uma distribuição normal, esperamos que aproximadamente 95% dos centros tenham um valor dentro de 2 desvios padrão da média de zero, de modo que a probabilidade de ser tratado pelo homem comum variará entre os centros com intervalo de cobertura de:

exp(-1.804469-2*0.6554)/(1+exp(-1.804469-2*0.6554))

exp(-1.804469+2*0.6554)/(1+exp(-1.804469+2*0.6554))

Isso está correto?

Além disso, como posso testar no glmer se a variabilidade entre os centros é estatisticamente significativa? Eu costumava trabalhar com o MIXNO, um excelente software de Donald Hedeker, e aí tenho um erro padrão da variação estimada, que não tenho no glmer. Como posso ter a probabilidade de ser tratado pelo homem "médio" em cada centro, com um intervalo de confidencialidade?

obrigado

user2310909
fonte

Respostas:

10

Provavelmente é mais útil se você nos mostrar mais informações sobre o seu modelo, mas: o valor da linha de base das probabilidades de log de qualquer que seja a sua resposta (por exemplo, mortalidade) varia entre os hospitais. O valor da linha de base (o termo de interceptação por hospital) é a probabilidade de logaritmo da mortalidade (ou qualquer outra coisa) na categoria da linha de base (por exemplo, "não tratada"), com um valor zero de quaisquer preditores contínuos. Presume-se que essa variação seja distribuída normalmente, na escala de log-odds. O desvio padrão intra-hospitalar da interceptação é 0,6554; a variação (apenas o desvio padrão ao quadrado - não é uma medida da incerteza do desvio padrão) é .0,65542=0,4295

(Se você esclarecer sua pergunta / adicionar mais detalhes sobre o seu modelo, posso tentar dizer mais.)

update : sua interpretação da variação parece correta. Mais precisamente,

cc <- fixef(fitted_model)[1] ## intercept
ss <- sqrt(unlist(VarCorr(fitted_model))) ## random effects SD
plogis(qnorm(c(0.025,0.975),mean=cc,sd=ss))

deve fornecer um intervalo de 95% (não intervalos de confiança realmente, mas muito semelhantes) para as probabilidades de um indivíduo de linha de base (masculino / idade média / etc.) ser tratado em hospitais.

Para testar a significância do efeito aleatório, você tem várias opções (consulte http://bbolker.github.io/mixedmodels-misc/glmmFAQ.html para obter mais informações). (Observe que o erro padrão de uma variação de ER geralmente não é uma maneira confiável de testar a significância, já que a distribuição da amostra geralmente é distorcida / não-Normal.) A abordagem mais simples é fazer um teste de razão de verossimilhança, por exemplo

pchisq(2*(logLik(fitted_model)-logLik(fitted_model_without_RE)),
       df=1,lower.tail=FALSE)/2

A divisão final por 2 corrige o fato de que o teste da razão de verossimilhança é conservador quando o valor nulo (ie variância RE = 0) está no limite do espaço viável (ie a variância RE não pode ser <0).

Ben Bolker
fonte
Eu editei a pergunta
user2310909
11
Obrigado, é um prazer ler para alguém que conhece bem o assunto.
user2310909