Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)?
Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis tiverem valores ausentes, mas não a um nível tão alto?
missing-data
data-imputation
usuario
fonte
fonte
Respostas:
A partir dos comentários, você está confiante de que está em uma situação de MAR ou MCAR. Então a imputação múltipla é pelo menos razoável. Então, quanta falta é tratável? Pense desta maneira:
Basicamente, a imputação múltipla faz com que todas as estimativas de parâmetros do modelo sejam menos certas em função da precisão com que os dados ausentes podem ser previstos com o modelo de imputação, o que dependerá, entre outras coisas, da quantidade de falta que precisa ser imputada e a número de imputações que você usa.
Quanto é falta em excesso, portanto, depende da quantidade de variação / incerteza que você está disposto a suportar. Uma quantidade útil para você pode ser a eficiência relativa (R E ) de uma análise de MI. Isso depende da 'fração de informações ausentes' (não da simples taxa de falta), geralmente chamadaλ e o número de imputações, geralmente chamado m , Como R E≈ 1 / ( 1 + λ / m ) .
Em vez de gerar as definições de informações ausentes etc. aqui, você pode simplesmente ler as Perguntas frequentes sobre MI, que colocam as coisas com muita clareza. A partir daí, você saberá se deseja abordar as fontes originais: Rubin etc.
Na prática, você provavelmente deveria apenas tentar uma análise de imputação e ver como ela funciona.
fonte
Você pode encontrar
útil.
fonte