Eu usei várias imputações para obter vários conjuntos de dados concluídos.
Eu usei métodos bayesianos em cada um dos conjuntos de dados concluídos para obter distribuições posteriores para um parâmetro (um efeito aleatório).
Como posso combinar / agrupar os resultados para este parâmetro?
Mais contexto:
Meu modelo é hierárquico no sentido de alunos individuais (uma observação por aluno) agrupados nas escolas. Fiz várias imputações (usando MICE
em R) nos meus dados, onde incluí school
como um dos preditores para os dados ausentes - para tentar incorporar a hierarquia de dados nas imputações.
Eu ajustei um modelo simples de inclinação aleatória para cada um dos conjuntos de dados concluídos (usando MCMCglmm
em R). O resultado é binário.
Eu descobri que as densidades posteriores da variação aleatória da inclinação são "bem comportadas" no sentido de que elas se parecem com isso:
Como posso combinar / agrupar as médias posteriores e os intervalos credíveis de cada conjunto de dados imputados, para esse efeito aleatório?
Update1 :
Pelo que entendi até agora, eu poderia aplicar as regras de Rubin à média posterior, para fornecer uma média posterior multiplicada por imputação - há algum problema em fazer isso? Mas não tenho ideia de como posso combinar os intervalos de 95% de credibilidade. Além disso, como tenho uma amostra real de densidade posterior para cada imputação - eu poderia, de alguma forma, combiná-las?
Update2 :
Conforme a sugestão de @ cyan nos comentários, eu gosto muito da idéia de simplesmente combinar as amostras das distribuições posteriores obtidas de cada conjunto de dados completo de várias imputações. No entanto, gostaria de saber a justificativa teórica para fazer isso.
fonte
Respostas:
Com posteriores particularmente bem comportados que podem ser adequadamente descritos por uma descrição paramétrica de uma distribuição, você pode simplesmente pegar a média e a variação que melhor descrevem o posterior e partir daí. Eu suspeito que isso possa ser adequado em muitas circunstâncias em que você não está recebendo distribuições posteriores genuinamente estranhas.
fonte
Se você usar stata, existe um procedimento chamado "mim" que agrupou os dados após a imputação usando modelos de efeito misto. Não sei se está disponível em R.
fonte