Valores ausentes na variável de resposta no JAGS

10

Gelman e Hill (2006) dizem:

No Bugs, os resultados ausentes em uma regressão podem ser manipulados facilmente, simplesmente incluindo o vetor de dados, NAs e tudo. Os bugs modelam explicitamente a variável de resultado e, portanto, é trivial usar esse modelo para, de fato, atribuir valores ausentes a cada iteração.

Parece uma maneira fácil de usar o JAGS para fazer previsões. Mas as observações com os resultados ausentes também afetam as estimativas de parâmetros? Em caso afirmativo, existe uma maneira fácil de manter essas observações no conjunto de dados que o JAGS vê, mas não para que elas afetem as estimativas de parâmetros? Eu estava pensando sobre a função de corte, mas isso só está disponível no BUGS, não no JAGS.

Jack Tanner
fonte

Respostas:

11

Sim, é realmente fácil de usar em BUGS ou JAGS! É realmente um prazer usá-lo!

Mas as observações com os resultados ausentes também afetam as estimativas de parâmetros?

Claro que não. Os parâmetros são afetados apenas pelos resultados observados. Os resultados perdidos (NAs) não afetarão nada, na verdade é o contrário: os resultados perdidos serão derivados dos parâmetros. Observe que os resultados ausentes também terão sua distribuição posterior. Então é muito fácil calcular algumas quantidades derivadas, por exemplo, uma soma sobre os índices do resultado, e essas quantidades derivadas não apenas são tratadas para valores ausentes, mas também têm sua distribuição posterior imediatamente. É isso que é tão sexy em BUGS & JAGS!

Diverta-se!

Curioso
fonte
11
Desculpe, não estou convencido de que os resultados ausentes não afetem as estimativas de parâmetros. Jackman parece dizer o oposto: jackman.stanford.edu/blog/?p=38
Jack Tanner
@ JackTanner, pense um pouco. Como o valor ausente pode afetar alguma coisa? À medida que o algoritmo inicia, o valor ausente começará a ser imputado a partir das estimativas dos parâmetros (elas são derivadas dos resultados observados). Então (talvez não tenha certeza), as informações do resultado ausente imputado podem retornar aos parâmetros, mas isso não importa - são apenas as informações originais, presentes nos parâmetros, retornadas a eles. A informação REAL que afeta algo é proveniente apenas dos resultados reais. Se você não confia em mim, faça uma simulação, compare os resultados e poste aqui.
curioso
Em relação ao seu link, ele aparentemente não tem certeza, diz "problema" - entre aspas e diz "seria interessante compará-lo". Eu digo que não haverá diferença significativa. Se você quiser testá-lo, vá em frente.
curioso
3
Concordo; nenhuma diferença significativa. Eu uso essa abordagem para construir distribuições preditivas posteriores; basta colocar os valores preditivos das variáveis ​​do lado direito juntamente com os valores anteriores e os NAs para a variável de destino "observações" correspondentes aos valores preditivos.
jbowman
@bowman, sim, boa nota! Não é uma idéia óbvia fazer previsões dessa maneira!
curioso