Estou preocupado com o problema de que eu gostaria de inicializar o valor-p para uma estimativa de partir de dados de multiplicação imputada (MI), mas não está claro para mim como combinar os valores-p entre os conjuntos de MI.
Para conjuntos de dados de MI, a abordagem padrão para obter a variação total das estimativas usa as regras de Rubin. Veja aqui uma revisão do conjunto de conjuntos de dados MI. A raiz quadrada da variância total serve como uma estimativa de erro padrão de . No entanto, para alguns estimadores, a variância total não possui forma fechada conhecida ou a distribuição da amostra não é normal. A estatística θ / s e ( θ ) pode então não ser distribuída t, nem mesmo assintoticamente.
Portanto, no caso completo dos dados, uma opção alternativa é inicializar a estatística para encontrar variância, valor-p e intervalo de confiança, mesmo se a distribuição da amostra não for normal e sua forma fechada desconhecida. No caso do MI, existem duas opções:
- Agrupe a variação de inicialização nos conjuntos de dados MI
- Agrupe o valor-p ou os limites de confiança nos conjuntos de dados MI
A primeira opção usaria novamente as regras do Rubin. No entanto, acredito que isso é problemático, se tiver uma distribuição amostral não normal. Nesta situação (ou mais geralmente, em todas as situações), o valor de p inicializado pode ser usado diretamente. No entanto, no caso do MI, isso levaria a vários valores de p ou intervalos de confiança, que precisam ser agrupados entre os conjuntos de dados do MI.
Portanto, minha pergunta é: como devo agrupar vários valores p inicializados (ou intervalos de confiança) em conjuntos de dados multiplicados por imputação?
Gostaria de receber sugestões sobre como proceder, obrigado.
Respostas:
Eu acho que as duas opções resultam na resposta correta. Em geral, eu preferiria o método 1, pois preserva toda a distribuição.
Para o método 2, use o procedimento Licht-Rubin. Consulte Como obter valores-p agrupados em testes realizados em vários conjuntos de dados imputados?
fonte
Esta não é uma literatura com a qual estou familiarizado, mas uma maneira de abordar isso pode ser ignorar o fato de que esses são valores-p com inicialização e examinar a literatura sobre a combinação de valores-p em conjuntos de dados multiplicados por imputação.
Nesse caso, Li, Meng, Raghunathan e Rubin (1991) se aplicam. O procedimento é baseado em estatísticas de cada um dos conjuntos de dados imputados, ponderados usando uma medida da perda de informações devido à imputação. Eles se deparam com questões relacionadas à distribuição conjunta das estatísticas entre imputações e fazem algumas suposições simplificadoras.
De interesse relacionado é Meng (1994) .
Atualizar
Um procedimento para combinar valores-p em conjuntos de dados multiplicados é descrito na dissertação de Christine Licht, cap. 4 . A idéia, que ela atribui a Don Rubin, é essencialmente transformar os valores de p a serem normalmente distribuídos, que podem ser combinados entre os conjuntos de dados de MI, usando as regras padrão para a combinação de estatísticas z.
fonte