Eu tenho um conjunto de dados que analisa solicitações de imigração e aceitação de vistos (concessão de vistos). As taxas são calculadas para "aceito" e "rejeitado" dos pedidos de visto.
No entanto, o conjunto de dados também possui valores para casos que foram fechados. Normalmente é quando o imigrante para de comparecer a compromissos, migra para outro lugar ou morre. Como esses números não são usados quando as taxas são calculadas, as taxas geralmente aparecem como ausentes (porque os casos não foram aceitos nem rejeitados).
Dito isto, se os únicos casos para esse ano foram "encerrados de outra forma", será bom abandonar essas observações? Parte do problema que estou tendo é que anos aleatórios no conjunto de dados serão descartados, porque as únicas decisões para esse ano foram fechadas.
Os casos encerrados de outra forma são muito arbitrários e, como mencionei, são provavelmente os casos em que o imigrante migrou para outro lugar e provavelmente apenas usou o primeiro país como local de trânsito temporário. Os dados não dizem especificamente por que os imigrantes foram embora, por que foram fechados etc. Não tenho muita certeza de como lidar com esses valores ausentes. Não acredito que os métodos padrão de imputação funcionem aqui, devido aos cálculos de taxa (mas posso estar errado).
fonte
Respostas:
A distinção importante não é, no seu caso, a distinção entre MCAR, MAR e NMAR, mas entre valores omissos reais e valores omissos mecânicos. Valores ausentes reais são valores que existem, mas por algum motivo não foram registrados. Os valores faltantes mecânicos não existem, mas a estrutura retangular de um conjunto de dados nos obriga a atribuir um valor a ele, por exemplo, status de gravidez se seu conjunto de dados também incluir homens. As técnicas de imputação são projetadas para valores ausentes reais. Seu exemplo é um caso de valores ausentes mecânicos; a decisão não foi tomada, portanto seu valor não existe. Se uma parte substancial dos migrantes seguir em frente, essa é uma característica importante do processo de migração, e a imputação desses valores oculta essa característica.
fonte
É evidente uma mistura de pelo menos 2 processos diferentes de falta.
O que fazer com o MNAR é difícil. Assumir que esses casos não tiveram sucesso pode ser um pouco extremo (ou muito apropriado, afinal, eles não tiveram sucesso). Ou impute ao MAR e tente tornar esses casos menos bem-sucedidos até atingir 0% e contemplar esse intervalo de valores.
fonte