Problema
Estou escrevendo uma função R que executa uma análise bayesiana para estimar uma densidade posterior, dados e dados prévios informados. Gostaria que a função envie um aviso se o usuário precisar reconsiderar o anterior.
Nesta questão, estou interessado em aprender a avaliar a priori. As perguntas anteriores abordaram a mecânica de declarar priores informados ( aqui e aqui .)
Os seguintes casos podem exigir que o anterior seja reavaliado:
- os dados representam um caso extremo que não foi contabilizado ao declarar o
- erros nos dados (por exemplo, se os dados estiverem em unidades de g quando o anterior estiver em kg)
- o prior errado foi escolhido entre um conjunto de antecedentes disponíveis devido a um erro no código
No primeiro caso, os antecedentes geralmente ainda são difusos o suficiente para que os dados geralmente os sobrecarregem, a menos que os valores estejam em um intervalo não suportado (por exemplo, <0 para logN ou Gamma). Os outros casos são bugs ou erros.
Questões
- Existem problemas relacionados à validade do uso de dados para avaliar a priori?
- existe algum teste específico mais adequado para esse problema?
Exemplos
Aqui estão dois conjuntos de dados com pouca correspondência com um anterior porque são de populações com (vermelho) ou (azul).N ( 0 , 5 ) N- ( 8 , 0.5 )
Os dados em azul podem ser uma combinação válida + de dados anteriores, enquanto os dados em vermelho exigiriam uma distribuição anterior suportada por valores negativos.
set.seed(1)
x<- seq(0.01,15,by=0.1)
plot(x, dlnorm(x), type = 'l', xlim = c(-15,15),xlab='',ylab='')
points(rnorm(50,0,5),jitter(rep(0,50),factor =0.2), cex = 0.3, col = 'red')
points(rnorm(50,8,0.5),jitter(rep(0,50),factor =0.4), cex = 0.3, col = 'blue')
fonte
Aqui estão meus dois centavos:
Eu acho que você deveria se preocupar com os parâmetros anteriores associados às taxas.
Você fala sobre informações prévias, mas acho que você deve alertar os usuários sobre o que é uma informação não informativa razoável. Quero dizer, às vezes uma normal com média zero e variação de 100 é bastante pouco informativa e outras vezes informativa, dependendo das escalas utilizadas. Por exemplo, se você está regredindo salários em alturas (centímetros) do que o anterior acima, é bastante informativo. No entanto, se você regredir os salários em altura (metros), o anterior acima não é tão informativo.
Se você estiver usando um prior que é resultado de uma análise anterior, ou seja, o novo prior é, na verdade, um antigo posterior de uma análise anterior, as coisas serão diferentes. Estou assumindo que este é o caso.
fonte