Qual é a diferença entre equações de estimativa generalizada e GLMM?

Estou executando um GEE em dados desequilibrados em três níveis, usando um link de logit. Como isso difere (em termos das conclusões que posso tirar e do significado dos coeficientes) de um GLM com efeitos mistos (GLMM) e link logit?

Mais detalhes: As observações são ensaios únicos de bernoulli. Eles são agrupados em salas de aula e escolas. Usando R. Casewise omissão de NAs. 6 preditores também termos de interação.

(Não estou revirando as crianças para ver se elas pousam na cabeça.)

Estou inclinado a exponenciar os coeficientes em razão de chances. Isso tem o mesmo significado em ambos?

Há algo oculto no fundo da minha mente sobre "meios marginais" nos modelos de GEE. Eu preciso desse pouco explicado para mim.

Obrigado.

logistic mixed-model generalized-linear-model interpretation gee Rosser
fonte

As seguintes perguntas do CV também discutem este material: Diferença entre modelos lineares generalizados e modelos mistos lineares generalizados no SPSS ; Quando usar equações de estimativa generalizada versus modelos de efeitos mistos? .

gung - Restabelece Monica

Em termos de interpretação dos coeficientes, há uma diferença no caso binário (entre outros). O que difere entre GEE e GLMM é o objetivo da inferência: média populacional ou assunto específico .

Vamos considerar um exemplo simples de maquiagem relacionado ao seu. Você deseja modelar a taxa de reprovação entre meninos e meninas em uma escola. Como na maioria das escolas (primárias), a população de estudantes é dividida em salas de aula. É possível observar uma resposta binário a partir de crianças em salas de aula (por exemplo respostas binários agrupados por classe), onde se estudante a partir da sala de aula passou e se ele /ela falhou. E $Y$ $n_i$ $N$ $\sum_{i=1}^{N}n_{i}$ $Y_{ij}=1$ $j$ $i$ $Y_{ij}=0$ se o alunoda sala de aulafor do sexo masculino e 0 em caso contrário. $x_{ij} =1$ $j$ $i$

Para trazer a terminologia que usei no primeiro parágrafo, você pode pensar na escola como sendo a população e as salas de aula como os sujeitos .

Primeiro, considere o GLMM. O GLMM está adaptando um modelo de efeitos mistos. As condições do modelo na matriz de design fixa (que neste caso é composta pela interceptação e indicador de gênero) e quaisquer efeitos aleatórios entre as salas de aula que incluímos no modelo. Em nosso exemplo, vamos incluir uma interceptação aleatória, , que levará em consideração as diferenças de linha de base na taxa de falhas entre as salas de aula. Então estamos modelando $b_i$

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}, b_i\right)=\beta_0+\beta_1 x_{ij} + b_i$

O odds ratio de risco de falha no modelo acima difere com base no valor de que é diferente entre as salas de aula. Assim, as estimativas são específicas do assunto . $b_i$

O GEE, por outro lado, está se ajustando a um modelo marginal. Estes modelam médias populacionais . Você está modelando a expectativa condicional apenas em sua matriz de design fixa.

$\log \left(\frac{P(Y_{ij}=1)}{P(Y_{ij}=0)}\mid x_{ij}\right)=\beta_0+\beta_1 x_{ij}$

Isso contrasta com os modelos de efeitos mistos, conforme explicado acima, que condicionam a matriz de design fixa e os efeitos aleatórios. Portanto, com o modelo marginal acima, você está dizendo: "esqueça a diferença entre as salas de aula, eu só quero a taxa de reprovação da população (escolar) e sua associação com o gênero". Você se ajusta ao modelo e obtém uma razão de chances que é a razão de chances média da população de falha associada ao sexo.

Portanto, você pode achar que suas estimativas do modelo GEE podem diferir das estimativas do modelo GLMM e isso ocorre porque elas não estão estimando a mesma coisa.

(No que diz respeito à conversão de razão de chances de log para razão de chances exponenciando, sim, você faz isso, seja uma estimativa em nível de população ou específica de um assunto)

Algumas notas / literatura:

Para o caso linear, a média da população e as estimativas específicas do sujeito são as mesmas.

Zeger et ai. 1988 mostrou que, para regressão logística,

$\beta_M\approx \left[ \left(\frac{16\sqrt{3}}{15\pi }\right)^2 V+1\right]^{-1/2}\beta_{RE}$

$\beta_M$ $\beta_{RE}$ $V$

Molenberghs, Verbeke 2005 tem um capítulo inteiro sobre modelos de efeitos marginais versus efeitos aleatórios.

Eu aprendi sobre isso e material relacionado em um curso muito baseado em Diggle, Heagerty, Liang, Zeger 2002 , uma ótima referência.

fonte

Mike: É muito simples dizer que um GEE está calculando a média dos efeitos aleatórios?

B_Miner

@B_Miner Não excessivamente simples em tudo, isso é exatamente o que você está fazendo :)

@ Mike Wierzbicki: Resposta agradável e limpa, Mike! Um pequeno detalhe que posso acrescentar em "Algumas notas / literatura": GEE e GLMM são os mesmos no caso linear (resposta gaussiana, link de identidade) somente quando você especifica uma matriz de correlação intercambiável para o GEE.

Também não há um GEE específico de um assunto?

Giordano

@MikeWierzbicki Então, se eu entendi direito, um GEE nada mais é do que um modelo simples de efeito misto sem efeitos aleatórios (tornando-o uma linha de regressão não linear simples)?

26616 Robin Kramer #

Qual é a diferença entre equações de estimativa generalizada e GLMM?

Respostas: