Se o interesse é apenas estimar os parâmetros de um modelo (estimativa pontual e / ou intervalo) e as informações anteriores não são confiáveis, fracas (sei que isso é um pouco vago, mas estou tentando estabelecer um cenário em que a escolha de um prior é difícil) ... Por que alguém escolheria usar a abordagem bayesiana com anteriores impróprios 'não informativos' em vez da abordagem clássica?
44
Respostas:
Por duas razões, pode-se usar uma abordagem bayesiana, mesmo se você estiver usando anteriores altamente não informativos:
fonte
Embora os resultados sejam muito semelhantes, suas interpretações diferem.
Intervalos de confiança implicam a noção de repetir um experimento várias vezes e ser capaz de capturar o parâmetro verdadeiro 95% das vezes. Mas você não pode dizer que tem 95% de chance de capturá-lo.
Intervalos credíveis (bayesiano), por outro lado, permitem dizer que existe uma "chance" de 95% de que o intervalo captura o valor verdadeiro. Atualização: Uma maneira mais bayesiana de colocar isso é que você pode ter 95% de confiança em seus resultados.
Isso ocorre apenas porque você passou de para usando a Regra de Baye.P ( H y p o t h e s i s | D um t um )P( D a t a | Hyp o t h e s i s ) P( Hyp o t h e s i s | D a t a )
fonte
Acredito que uma razão para fazer isso é que uma análise bayesiana fornece uma distribuição posterior completa. Isso pode resultar em intervalos mais detalhados do que o típico frequentista . Uma cotação aplicável, de Reis e Stedinger 2005, é:±2σ
Assim, por exemplo, você pode calcular intervalos credíveis para a diferença entre dois parâmetros.
fonte
Sir Harold Jeffreys foi um forte defensor da abordagem bayesiana. Ele mostrou que, se você usar antecedentes impróprios difusos, a inferência bayesiana resultante seria a mesma que a abordagem inferencial freqüentista (ou seja, as regiões credíveis bayesianas são as mesmas que os intervalos de confiança freqüentadores). A maioria dos bayesianos advoga priores informativos adequados. Existem problemas com os anteriores impróprios e alguns podem argumentar que nenhum anterior é realmente não informativo. Penso que os bayesianos que usam o prior desses Jeffreys o fazem como seguidores de Jeffreys. Dennis Lindley , um dos mais fortes defensores da abordagem bayesiana, tinha muito respeito por Jeffreys, mas defendia priores informativos.
fonte
A abordagem bayesiana tem vantagens práticas. Ajuda na estimativa, sendo frequentemente obrigatório. E permite novas famílias de modelos e ajuda na construção de modelos mais complicados (hierárquicos, multiníveis).
Por exemplo, com modelos mistos (incluindo efeitos aleatórios com parâmetros de variação), obtém-se melhores estimativas se os parâmetros de variação são estimados marginalizando sobre parâmetros de nível inferior (coeficientes do modelo; isso é chamado REML ). A abordagem bayesiana faz isso naturalmente. Com esses modelos, mesmo com REML, as estimativas de probabilidade máxima (ML) dos parâmetros de variância geralmente são zero ou enviesadas para baixo. Um prévio adequado para os parâmetros de variação ajuda.
Mesmo se a estimativa pontual ( PAM , máximo a posteriori) for usada, os anteriores alteram a família do modelo. A regressão linear com um grande conjunto de variáveis um pouco colineares é instável. A regularização de L2 é usada como remédio, mas é interpretável como um modelo bayesiano com estimativa gaussiana (não informativa) prévia e MAP. (A regularização L1 é um prior diferente e fornece resultados diferentes. Na verdade, aqui o prior pode ser um pouco informativo, mas trata das propriedades coletivas dos parâmetros, não de um único parâmetro.)
Portanto, existem alguns modelos comuns e relativamente simples em que uma abordagem bayesiana é necessária apenas para fazer a coisa!
As coisas são ainda mais favoráveis com modelos mais complicados, como a alocação latente de Dirichlet (LDA) usada no aprendizado de máquina. E alguns modelos são inerentemente bayesianos, por exemplo, aqueles baseados nos processos de Dirichlet .
fonte
fonte
Existem várias razões:
Agora, quanto às desvantagens de apenas usar preliminares não informativos, começando com o que eu acho mais importante e depois indo para alguns dos aspectos técnicos também bastante importantes:
O último ponto é um argumento para a preferência de anteriores bastante vagos (ou um pouco mais fracamente informativos) que garantam um posterior adequado. É certo que às vezes também pode ser difícil extrair amostras delas, e pode ser difícil perceber que todo o posterior não foi explorado. No entanto, métodos bayesianos com antecedentes vagos (mas adequados) em muitos campos demonstraram ter realmente boas propriedades de amostras pequenas de uma perspectiva freqüentista e você certamente poderia ver isso como um argumento para usá-las, enquanto que com um pouco mais de dados dificilmente haverá qualquer diferença versus métodos com anteriores não informativos.
fonte