Taxas ausentes e imputação múltipla

8

Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)?

Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis ​​tiverem valores ausentes, mas não a um nível tão alto?

usuario
fonte
Eu não consideraria 20% muito alto, por isso tenho certeza que a resposta para sua segunda pergunta é sim, embora não tenha uma justificativa rigorosa. Meu pressentimento é que o único limite é o que impede o funcionamento do algoritmo. Lembro-me vagamente de ver uma tabela no livro de Rubin mostrando resultados para taxas muito altas de desaparecimento. Se vale a pena (ao contrário de válido) fazer MI com taxas muito altas de falta é outra questão.
21912 Mark12
1
Depende muito de quanto você pode assumir que suas faltas estão faltando completamente ao acaso. Se houver uma alta porcentagem de faltas e elas não faltarem aleatoriamente, você poderá obter estimativas tendenciosas da imputação. Como isso deve ser feito nos casos presentes nos dados (por definição), onde existe um viés sistemático nos casos ausentes, os casos atuais podem não ser muito informativos do ponto de vista da precisão.
317 Michelle
@ mark999 - Obrigado pela resposta. Quando a taxa de falta de uma variável pode ser considerada alta? Em relação à sua última pergunta, você tem alguma resposta?
Nick
@Michelle - Obrigado. Felizmente a hipótese MAR é bastante plausível (e até mesmo o MCAR poderia ser considerado plausível)
Nick
@ Nick: Eu não sei o que deve ser considerado uma taxa muito alta, e não acho que seja necessário colocar um número específico. Não tenho resposta para a última pergunta.
mark999

Respostas:

3

A partir dos comentários, você está confiante de que está em uma situação de MAR ou MCAR. Então a imputação múltipla é pelo menos razoável. Então, quanta falta é tratável? Pense desta maneira:

Basicamente, a imputação múltipla faz com que todas as estimativas de parâmetros do modelo sejam menos certas em função da precisão com que os dados ausentes podem ser previstos com o modelo de imputação, o que dependerá, entre outras coisas, da quantidade de falta que precisa ser imputada e a número de imputações que você usa.

Quanto é falta em excesso, portanto, depende da quantidade de variação / incerteza que você está disposto a suportar. Uma quantidade útil para você pode ser a eficiência relativa (RE) de uma análise de MI. Isso depende da 'fração de informações ausentes' (não da simples taxa de falta), geralmente chamadaλe o número de imputações, geralmente chamado m, Como RE1/(1+λ/m).

Em vez de gerar as definições de informações ausentes etc. aqui, você pode simplesmente ler as Perguntas frequentes sobre MI, que colocam as coisas com muita clareza. A partir daí, você saberá se deseja abordar as fontes originais: Rubin etc.

Na prática, você provavelmente deveria apenas tentar uma análise de imputação e ver como ela funciona.

conjugado
fonte
o link da FAQ está quebrado. Alguma chance de você ter uma atual? (parece útil)
drstevok 04/04
Adicionado. Não tenho certeza de como é oficial.
conjugateprior
1

Você pode encontrar

Rubin, Donald B. e Nathaniel Schenker. 1986. "Imputação Múltipla para Estimação de Intervalo de Amostras Aleatórias Simples com Não Resposta Ignorável". Jornal da Associação Estatística Americana 81 (394): 366-374.

útil.

RTM
fonte
1
Você poderia resumir em poucas palavras as recomendações de Rubin para que essa resposta permaneça independente?
chl
Eu vou ter que entender isso. Eu também ouvi Joe Shaffer, da Penn State, dizer (muito mais recentemente) que o MI é bom, a menos que os dados sejam "REALMENTE não-ignoráveis"
Peter Flom
@ Peter Flom: A declaração de Shaffer é interessante - você conhece algum detalhe?
21412 Mark12
1
@ Peter Flom: Obrigado (por engano, interpretei o seu "muito mais recentemente" como "recentemente").
mark999
1
@Peter Flom. Erro de digitação da minha parte, eu tenho medo. O restante do meu comentário faz sentido se você colocar o "não" ausente na frente!
conjugateprior