Eu tenho uma regressão logística de interceptação aleatória (devido a medições repetidas) e gostaria de fazer alguns diagnósticos, especificamente sobre discrepâncias e observações influentes.
Eu olhei para resíduos para ver se há observações que se destacam. Mas também gostaria de ver algo como a distância de Cook ou DFFITS. Hosmer e Lemeshow (2000) dizem que, devido à falta de ferramentas de diagnóstico de modelo para dados correlacionados, deve-se apenas ajustar um modelo de regressão logística regular, ignorando a correlação e usar as ferramentas de diagnóstico disponíveis para a regressão logística regular. Eles argumentam que isso seria melhor do que não fazer nenhum diagnóstico.
O livro é de 2000 e gostaria de saber se existem métodos disponíveis agora para o diagnóstico de modelos com regressão logística de efeitos mistos. Qual seria uma boa abordagem para verificar discrepâncias?
Editar (5 de novembro de 2013):
Devido à falta de respostas, pergunto-me se o diagnóstico com modelos mistos não é feito em geral ou não é uma etapa importante ao modelar dados. Então, deixe-me reformular minha pergunta: O que você faz quando encontra um modelo de regressão "bom"?
fonte
Respostas:
Os métodos de diagnóstico são realmente diferentes para modelos mistos lineares generalizados. Um razoável que vi que é baseado em resíduos de um GLMM deve-se a Pan e Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x) Eles usam somas cumulativas de resíduos onde a ordem é imposta pelas variáveis explicativas ou pelo preditor linear, testando, assim, a especificação da forma funcional de um determinado preditor ou a função de link como um todo. As distribuições nulas são baseadas em simulações do espaço de design a partir da distribuição nula de especificações corretas e demonstraram tamanho decente e propriedades de energia desse teste. Eles não discutiram os valores discrepantes especificamente, mas posso imaginar que os discrepantes provavelmente devessem jogar pelo menos a função de link, curvando-a demais em relação à observação influente.
fonte
Há muitas opiniões diferentes sobre qual é a melhor maneira de analisar os diagnósticos para modelos mistos. Geralmente, você deve considerar os aspectos residuais e padrão que seriam examinados para um modelo de medidas não repetidas.
Além desses, normalmente, você também vai querer observar os efeitos aleatórios. Os métodos geralmente envolvem a plotagem dos efeitos aleatórios por várias covariáveis e a busca de não normalidade na distribuição dos efeitos aleatórios. Existem muitos outros métodos (alguns mencionados nos comentários anteriores), mas esse geralmente é um bom começo.
fonte