Eu ficaria grato por conselhos sobre como abordar a seguinte situação: Eu tenho uma variável de contagem X e quatro variáveis binárias A, B, C, D. A variável de contagem é a variável independente (refere-se ao número de experiências adversas na infância ) e os binários são variáveis dependentes (eles se referem a determinados resultados adversos na idade adulta). Um respondente no conjunto de dados pode ter qualquer combinação de resultados, por exemplo, A, AC, BCD etc. Desejo medir a força da associação entre a variável de contagem X e os resultados A, B, C, D condicionais nos níveis da outros resultados.
Não tenho certeza da melhor maneira de abordar isso. Seria justificado reverter o papel das variáveis e tratar a variável de contagem X como resultado e a DA como preditora? Portanto, isso seria regressão binomial negativa (há super-dispersão). Dessa forma, a associação entre X e A (B, C ...) seria estimada mantendo outras variáveis binárias constantes. Mas parece-me que logicamente seria desonesto, pois estaríamos prevendo algo que aconteceu mais cedo com algo que aconteceu mais tarde.
Ou devo usar MANOVA (mas li em algum lugar que a interpretação dos resultados não é direta).
Ou devo usar um modelo misto linear generalizado (nunca tentei antes) como sugerido aqui https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2798811/ .
measure the strength of the association between the count variable X and the outcomes A, B, C, D conditional on the levels of the other outcomes
Esse "condicional" sugere, na verdade, que os resultados binários são os preditores.predicting something that happened earlier with something that happened later
não é um problema, pois estamos no domínio da análise, não da "natureza".Respostas:
Você está assumindo fortemente que todos os eventos da infância têm peso igual na previsão de resultados para adultos. Mas, considerando isso, existem várias maneiras possíveis de proceder. Aqui estão três abordagens principais, uma das quais você já mencionou.
Você não mencionou o tamanho da amostra, mas isso pode ser um problema. São necessárias pelo menos 96 observações apenas para estimar uma proporção simples e simples, sem covariáveis.
fonte
O modelo probit multivariado pode ser considerado, conforme descrito no livro de Greene mencionado por Frank Harrell. Ver também (Lesaffre e Mohlenberghs, 1991 Stat. Med 10, 1391-1403). A idéia é pensar em uma distribuição normal (4 dimensões) multivariada de propensão ou tolerância em relação a cada evento. Você modela o vetor médio normal multivariado como quatro funções da (s) variável (s) independente (s). Estime a probabilidade de cada evento, dado o vetor médio via função de ligação probit.
Pesquise no Google o livro Greene. Você encontrará alguns "links" úteis.
fonte