Atualmente, estou executando um modelo de regressão múltipla usando dados imputados e tenho algumas perguntas.
Fundo:
Usando o SPSS 18. Meus dados parecem ser MAR. A exclusão listwise de casos me deixa com apenas 92 casos, a imputação múltipla deixa 153 casos para análise. Todas as premissas atendidas - um log variável transformado. 9 IV's 5 - 5 categóricos, 3 escalas, 1 intervalo. Escala DV. Usando o método enter da regressão múltipla padrão.
- Meu DV é a diferença de pontuação entre uma medida de pré-pontuação e pós-pontuação, essas duas variáveis estão faltando vários casos - devo atribuir valores ausentes para cada uma delas e depois calcular a diferença entre elas para calcular minha DV (como faço para fazer isso) ou posso apenas imputar dados para o meu DV? Qual é a abordagem mais apropriada?
- Devo executar imputações em dados transformados ou dados não transformados distorcidos?
- Devo inserir todas as variáveis no processo de imputação, mesmo que não estejam faltando dados, ou devo apenas imputar dados para as variáveis que faltam em mais de 10% dos casos?
Eu executei a regressão nos casos excluídos listwise e os meus IVs representam muito pouca variação no meu DV; posteriormente, executei a regressão em um arquivo completo após imputação múltipla - Os resultados são muito semelhantes, pois meus 9IVs ainda prever apenas aproximadamente 12% da variação no meu DV, no entanto, agora um dos meus IV'S indica que está fazendo uma contribuição significativa (essa é uma variável transformada em log) ...
- Devo relatar dados originais se houver pouca diferença entre minhas conclusões - ou seja, meus IVs mal prevêem o dv ou relatam os dados completos?
R^2
ocorra uma baixa ). Veja aqui uma boa discussão sobre designs pré-pós . Embora isso ainda não responda totalmente à sua pergunta!Respostas:
Referências
Edwards, JR (1994). Análise de regressão como alternativa aos escores de diferença. Journal of Management , 20 , 683-689.
Enders, CK (2010). Análise de dados ausentes aplicada . Nova York, NY: Guilford Press.
fonte
Na minha experiência, a função de imputação do SPSS é fácil de usar, tanto na criação de conjuntos de dados quanto na análise e agrupamento dos conjuntos de dados de imputação resultantes. No entanto, sua facilidade de uso também é sua queda. Se você observar uma função de imputação semelhante no
R
software estatístico (veja, por exemplo, omice
pacote), verá muito mais opções. Consulte o site da Stef van Buurens para obter uma excelente explicação sobre imputações múltiplas em geral (com ou sem o uso do pacote de mouses).É muito importante observar que essas opções adicionais não são escolhas de "luxo" apenas para usuários avançados . Alguns são essenciais para obter a devida simpatia , modelos específicos para variáveis ausentes específicas , preditores específicos para variáveis ausentes específicas , diagnóstico de imputação e muito mais, que não estão disponíveis na função de imputação do SPSS.
Quanto às suas perguntas:
fonte