Como posso avaliar o ajuste do modelo GEE / logístico quando covariáveis ​​têm alguns dados ausentes?

9

Eu ajustei dois modelos de equações de estimativa generalizada (GEE) aos meus dados:

1) Modelo 1: O resultado é uma variável longitudinal Sim / Não (A) (ano 1,2,3,4,5) com preditor contínuo longitudinal (B) para os anos 1,2,3,4,5.

2) Modelo 2: O resultado é a mesma variável longitudinal Sim / Não (A), mas agora com meu preditor fixo no valor do ano 1, ou seja, forçado a ser invariante no tempo (B).

Devido à falta de medidas no meu preditor longitudinal em alguns momentos para casos diferentes, o número de pontos de dados no modelo 2 é maior que no modelo 1.

Gostaria de saber quais comparações posso validamente fazer entre as razões de chances, valores de p e ajuste dos dois modelos, por exemplo:

  • Se o OR do preditor B for maior no modelo 1, posso dizer validamente que a associação entre A e B é mais forte no modelo1?

  • Como posso avaliar qual é o melhor modelo para meus dados. estou correto ao pensar que os pseudo-quadrados QIC / AIC não devem ser comparados entre modelos se o número de observações não for o mesmo?

Qualquer ajuda seria muito apreciada.

N26
fonte
Como o Modelo 2 não é realmente considerado "aninhado" do Modelo 1, não sei quão válido seria o uso do QIC para avaliar o ajuste comparativo. Um pensamento que eu tinha era usar várias técnicas de imputação para igualar o número de observações e, em seguida, era possível comparar os valores de QIC para esses modelos. No entanto, alguma literatura, por exemplo, "Análise de dados longitudinal aplicada para epidemiologia" da Twisk, mostrou resultados realmente inconsistentes usando técnicas de IM em modelos que possuem variáveis ​​de resposta dicotômicas. Eu gostaria de poder ajudar mais.
Iris Tsui
11
Por que os valores estão ausentes? A falta deles é sistemática de uma maneira que torna os valores ausentes fundamentalmente diferentes dos valores não ausentes?
Macro

Respostas:

1

Eu definitivamente tentaria imputação múltipla (por exemplo, com camundongos ou Amelia em R), possivelmente com vários métodos alternativos para atribuir valores ausentes.

No pior cenário, você pode considerar uma análise de sensibilidade.

Joe_74
fonte