Fiquei me perguntando se alguém tinha experiência usando a função de ratos, como descrito em ratos: Imputação multivariada por equações encadeadas em R (JSS 2011 45 (3))? Eu tenho um conjunto de dados com um número de variáveis, cada uma com diferentes graus de dados ausentes.
Minha pergunta principal é: digamos que eu uso a regressão linear bayesiana para imputar dados ausentes, usa mice
automaticamente variáveis preditivas do mais significativo para o menos significativo para imputar? Além disso, é comum, talvez, calcular a média de todos os conjuntos de dados imputados?
r
regression
bayesian
data-imputation
mice
mjburns
fonte
fonte
Respostas:
Por padrão, os mouses usarão todas as variáveis do seu conjunto de dados para prever qualquer outra.
Quanto à média, você precisa fazer isso depois de calcular suas estatísticas, não antes. Por exemplo, se você quiser fazer uma regressão linear, faça algo assim:
A função de resumo mostrará os coeficientes médios.
fonte