Um prior vago é o mesmo que um prior não informativo?

27

Esta é uma pergunta sobre terminologia. Um "anterior vago" é o mesmo que um anterior não informativo ou existe alguma diferença entre os dois? Minha impressão é de que são iguais (de procurar vagas e não informativas juntas), mas não tenho certeza.

bayesiano
fonte
1
Vagamente: Sim. Não informativo: Não.
cardeal

Respostas:

18

Gelman et al. (2003) dizem:

há muito tempo existe um desejo de distribuições anteriores que possam garantir um papel mínimo na distribuição posterior. Tais distribuições às vezes são chamadas de 'distribuições anteriores de referência' e a densidade anterior é descrita como vaga, plana ou não informativa . [Ênfase do texto original]

Com base na minha leitura da discussão do anterior de Jeffreys em Gelman et al. (2003, p.62ff), não há consenso sobre a existência de um prior verdadeiramente não informativo e que antecedentes suficientemente vagos / planos / difusos são suficientes.

Alguns dos pontos que eles fazem:

  1. Qualquer prévia inclui informações, incluindo anteriores que afirmam que nenhuma informação é conhecida.
    • Por exemplo, se sabemos que nada sabemos sobre o parâmetro em questão, sabemos algo sobre ele.
  2. Na maioria dos contextos aplicados, não há clara vantagem de um prior verdadeiramente não informativo quando os antecedentes suficientemente vagos são suficientes e, em muitos casos, existem vantagens - como encontrar um prior adequado - em usar uma vaga parametrização de um conjugado anterior.
  3. O princípio de Jeffreys pode ser útil para construir anteriores que minimizem o conteúdo de informações de Fisher em modelos univariados, mas não há análogo para o caso multivariado
  4. Ao comparar modelos, o prior de Jeffreys variará com a distribuição da probabilidade, portanto os anteriores também terão que mudar
  5. geralmente tem havido muito debate sobre a existência de um prévio não informativo (por causa de 1, mas também ver discussões e referências na p.66 em Gelman et al. para a história desse debate).

note que este é um wiki da comunidade - A teoria subjacente está nos limites do meu entendimento e eu gostaria de receber contribuições para esta resposta.

Gelman et al. 2003 Análise de Dados Bayesiana, Chapman e Hall / CRC

David
fonte
1
O próprio Gelman foi além dos anteriores "não informativos"; veja, por exemplo, stat.columbia.edu/~cook/movabletype/archives/2007/07/… e o artigo que eu refiro na minha resposta, e outros trabalhos dele. Essa atitude parece cada vez mais prevalente entre os estatísticos aplicados.
JMS
@JMS Gelman et. al. 2003 fez este ponto, e eu tentei resumir, eles parecem considerar os priores noninformative para o fundo / fins teóricos / heurísticos
David LeBauer
Sim, um livro de estatística bayesiana certamente não pode ignorá-las. Eu só queria acrescentar que a tendência em estatística aplicada, desde então, tem sido a de afastar-se destas opções tradicionais, embora o trabalho continua em "Bayes objetivo"
JMS
Eu acho que as pessoas tendem a usar as informações de duas maneiras ao descrever os anteriores, em um sentido informal e em um sentido teórico da informação. Assim, você pode criar uma entropia máxima prévia que contenha o mínimo de informação possível, no sentido teórico da informação. Usando esta distribuição, você (pode) sinalizar que "você não sabe nada sobre o parâmetro", isso pode ser bastante informativo em um sentido mais informal ...
Rasmus Bååth
9

Definitivamente não, embora sejam frequentemente usados ​​de forma intercambiável. Um anterior vago (relativamente desinformado, que realmente não favorece alguns valores sobre outros) em um parâmetro pode realmente induzir um anterior muito informativo sobre alguma outra transformação . Isso é pelo menos parte da motivação do prior de Jeffreys, que foi inicialmente construído para ser o mais informativo possível.f ( θ )θf(θ)

Priores vagas também podem fazer algumas coisas bastante infelizes para o seu modelo. O exemplo agora clássico está usando como nos componentes de variação em um modelo hierárquico.ε 0InverseGamma(ϵ,ϵ)ϵ0

O limite prévio inadequado fornece um posterior inadequado neste caso. Uma alternativa popular era considerar muito pequeno, o que resulta em uma prévia que parece quase uniforme em . Mas também resulta em uma parte posterior quase imprópria, e o encaixe e as inferências do modelo são afetados. Consulte Distribuições anteriores de Gelman para obter parâmetros de variação em modelos hierárquicos para obter uma exposição completa.R +ϵR+

Edit: @csgillespie (com razão!) Indica que não respondi completamente à sua pergunta. Na minha opinião, um prior não informativo é vago no sentido de que não favorece particularmente uma área do espaço de parâmetro em detrimento de outra, mas, ao fazê-lo, não deve induzir priori informativo sobre outros parâmetros. Portanto, um prior não informativo é vago, mas um prior vago não é necessariamente não informativo. Um exemplo em que isso entra em jogo é a seleção de variáveis ​​bayesianas; um prévio "vago" nas probabilidades de inclusão de variáveis ​​pode realmente induzir um prévio bastante informativo sobre o número total de variáveis ​​incluídas no modelo!

Parece-me que a busca por priores verdadeiramente não informativos é quixotesca (embora muitos discordem); é melhor usar os chamados anteriores informativos "fracamente" (que, suponho, são geralmente vagos em algum sentido). Realmente, com que frequência não sabemos nada sobre o parâmetro em questão?

JMS
fonte
Sua resposta é muito bom, mas na verdade você não indicar o que um "não-informativo antes" e como ela difere de uma "vaga antes";)
csgillespie
@cgillespie: Você está certo, editado :)
JMS
seguindo seu último parágrafo e apoiando a natureza quixotesca da pesquisa: se sabemos que nada sabemos sobre o parâmetro em questão, sabemos um pouco sobre ele.
David LeBauer
Bastante! A grande ironia é que muitos que gastam tanta energia com a mão na escolha do anterior não pensam duas vezes antes de jogar fora a probabilidade. Uma probabilidade mal especificada é muito mais suscetível de causar problemas, geralmente. Mas isso é outra questão inteiramente ...
JMS
5

Lambert et al (2005) levantam a questão "How Vague is Vague? Um estudo de simulação do impacto do uso de distribuições anteriores vagas no MCMC usando o WinBUGS ". Eles escrevem: "Não defendemos o uso do termo distribuição prévia não informativa, pois consideramos que todos os anteriores contribuem com algumas informações". Costumo concordar, mas definitivamente não sou especialista em estatísticas bayesianas.

Bernd Weiss
fonte
2
Isso concorda com minha crença prévia subjetiva de que não existe um prior não informativo.
onestop 22/02
@onestop por favor considere contribuindo para a minha resposta CW
David LeBauer
IG(ϵ,ϵ)ϵ0
3

Suspeito que "anterior vago" seja usado para significar um prior que é conhecido por codificar uma quantidade pequena, mas diferente de zero de conhecimento sobre o verdadeiro valor de um parâmetro, enquanto um "anterior não informativo" seria usado para significar ignorância completa em relação ao valor desse parâmetro. Talvez fosse usado para mostrar que a análise não era completamente objetiva.

Por exemplo, um gaussiano muito amplo pode ser um anterior vago para um parâmetro em que um anterior não informativo seria uniforme. O gaussiano seria muito próximo da escala de interesse, mas, no entanto, favoreceria um valor específico um pouco mais do que qualquer outro (mas pode tornar o problema mais matematicamente tratável).

Dikran Marsupial
fonte
isso levanta a questão: o uniforme seria realmente não informativo? qual seria o máximo e o mínimo do uniforme não informativo? O anterior não seria informativo após a transformação para outra escala?
David LeBauer
1
Priores uniformes não são necessariamente não informativos e vice-versa, depende da natureza do problema. Penso que a ideia de um prioritário minimamente informativo é muitas vezes mais realista, usando MAXENT e grupos de transformação para decidir sobre uma distribuição anterior que transmite a quantidade mínima de informações que consistem em restrições conhecidas (por exemplo, que o prioritário seja invariável à escala). Para muitos problemas, os antecedentes impróprios funcionam bem; portanto, não há necessariamente a necessidade de haver um mínimo e um máximo bem definidos.
Dikran Marsupial
2

Priores não informativos têm formas diferentes. Essas formas incluem antecedentes vagos e anteriores inadequados. Tão vaga anterior faz parte de anteriores não informativos.

user26652
fonte