Gostaria de obter conselhos sobre como agrupar os gráficos / estatísticas de calibração após imputação múltipla. No cenário do desenvolvimento de modelos estatísticos para prever um evento futuro (por exemplo, usando dados de registros hospitalares para prever a sobrevivência ou eventos após a alta hospitalar), pode-se imaginar que há algumas informações em falta. A imputação múltipla é uma maneira de lidar com essa situação, mas resulta na necessidade de agrupar as estatísticas de testes de cada conjunto de dados de imputação, levando em consideração a variabilidade adicional devido à incerteza inerente à imputação.
Entendo que existem várias estatísticas de calibração (hosmer-lemeshow, Emax de Harrell, índice estimado de calibração etc.), às quais podem ser aplicadas as regras 'regulares' do Rubin para pool.
No entanto, essas estatísticas geralmente são medidas gerais de calibração que não mostram regiões específicas não calibradas do modelo. Por esse motivo, prefiro olhar para um gráfico de calibração. Lamentavelmente, não sei como agrupar os gráficos ou os dados por trás deles (probabilidades previstas por indivíduo e resultado observado por indivíduo) e não consigo encontrar muita coisa na literatura biomédica (o campo com o qual estou familiarizado), ou aqui, no CrossValidated. Obviamente, olhar para o gráfico de calibração de cada conjunto de dados de imputação pode ser uma resposta, mas pode se tornar bastante incômodo (até o momento) quando muitos conjuntos de imputações são criados.
Por isso, gostaria de perguntar se existem técnicas que resultariam em um gráfico de calibração, agrupado após várias imputações (?)
Respostas:
Em relação às referências:
fonte