Modelos mistos lineares generalizados: diagnóstico

11

Eu tenho uma regressão logística de interceptação aleatória (devido a medições repetidas) e gostaria de fazer alguns diagnósticos, especificamente sobre discrepâncias e observações influentes.

Eu olhei para resíduos para ver se há observações que se destacam. Mas também gostaria de ver algo como a distância de Cook ou DFFITS. Hosmer e Lemeshow (2000) dizem que, devido à falta de ferramentas de diagnóstico de modelo para dados correlacionados, deve-se apenas ajustar um modelo de regressão logística regular, ignorando a correlação e usar as ferramentas de diagnóstico disponíveis para a regressão logística regular. Eles argumentam que isso seria melhor do que não fazer nenhum diagnóstico.

O livro é de 2000 e gostaria de saber se existem métodos disponíveis agora para o diagnóstico de modelos com regressão logística de efeitos mistos. Qual seria uma boa abordagem para verificar discrepâncias?

Editar (5 de novembro de 2013):

Devido à falta de respostas, pergunto-me se o diagnóstico com modelos mistos não é feito em geral ou não é uma etapa importante ao modelar dados. Então, deixe-me reformular minha pergunta: O que você faz quando encontra um modelo de regressão "bom"?

Emilia
fonte
Possível duplicata de uma questão recente similar que também não recebeu muita atenção: stats.stackexchange.com/q/70783/442
Henrik
Você pode achar útil a minha resposta para uma pergunta semelhante.
quer

Respostas:

2

Os métodos de diagnóstico são realmente diferentes para modelos mistos lineares generalizados. Um razoável que vi que é baseado em resíduos de um GLMM deve-se a Pan e Lin (2005, DOI: 10.1111 / j.1541-0420.2005.00365.x) Eles usam somas cumulativas de resíduos onde a ordem é imposta pelas variáveis ​​explicativas ou pelo preditor linear, testando, assim, a especificação da forma funcional de um determinado preditor ou a função de link como um todo. As distribuições nulas são baseadas em simulações do espaço de design a partir da distribuição nula de especificações corretas e demonstraram tamanho decente e propriedades de energia desse teste. Eles não discutiram os valores discrepantes especificamente, mas posso imaginar que os discrepantes provavelmente devessem jogar pelo menos a função de link, curvando-a demais em relação à observação influente.

StasK
fonte
0

Há muitas opiniões diferentes sobre qual é a melhor maneira de analisar os diagnósticos para modelos mistos. Geralmente, você deve considerar os aspectos residuais e padrão que seriam examinados para um modelo de medidas não repetidas.

Além desses, normalmente, você também vai querer observar os efeitos aleatórios. Os métodos geralmente envolvem a plotagem dos efeitos aleatórios por várias covariáveis ​​e a busca de não normalidade na distribuição dos efeitos aleatórios. Existem muitos outros métodos (alguns mencionados nos comentários anteriores), mas esse geralmente é um bom começo.

Bill Denney
fonte