Exemplos de abordagem bayesiana e freqüentista dando respostas diferentes

54

Nota: Estou ciente das diferenças filosóficas entre as estatísticas bayesianas e as freqüentadoras.

Por exemplo, "qual é a probabilidade de a moeda na mesa ser cara" não faz sentido nas estatísticas freqüentistas, já que ela já caiu na cara ou coroa - não há nada probabilístico nela. Portanto, a pergunta não tem resposta em termos freqüentes.

Mas essa diferença não é especificamente o tipo de diferença que estou perguntando.

Em vez disso, gostaria de saber como suas previsões para perguntas bem formadas diferem realmente no mundo real, excluindo quaisquer diferenças teóricas / filosóficas, como o exemplo que mencionei acima.

Então, em outras palavras:

O que é um exemplo de uma pergunta, responde em ambos frequencista e estatística Bayesiana, cuja resposta é diferente entre os dois?

(por exemplo, talvez um deles responda "1/2" a uma pergunta em particular e o outro responda "2/3".)

Existem diferenças?

  • Se sim, quais são alguns exemplos?

  • Se não, então quando é que realmente faz diferença se eu uso estatísticas bayesianas ou freqüentistas ao resolver um problema específico?
    Por que eu evitaria um em favor do outro?

Mehrdad
fonte
8
John Kruschke acabou de produzir dois vídeos, onde ele compara os métodos estatísticos bayesiano e padrão. Ele tem muitos exemplos em que o método bayesiano rejeita, mas o método padrão não. Talvez não seja exatamente o que você estava procurando, mas mesmo assim ... youtu.be/YyohWpjl6KU e youtu.be/IhlSD-lIQ_Y .
Rasmus Bååth
4
A distribuição binomial fornece outro exemplo em que a inferência freqüencialista (baseada em probabilidade) e a inferência bayesiana diferem em alguns casos. A probabilidade de perfil do parâmetro não decai para como ( consulte ) para algumas amostras. Isso implica que algum intervalo de probabilidade-confiança tem tamanho infinito. Por outro lado, a distribuição posterior marginal de sempre decai para como vez que é integrável. 0 N N 0 N N0NN0N
@ Procrastinator: Obrigado, estou vendo os slides mencionados agora. Isso parece um pouco mais intenso do que minha formação matemática, mas espero obter algo disso. :)
Mehrdad
2
Você pode dar uma olhada no exemplo de Stone. Eu explico no meu blog aqui: normaldeviate.wordpress.com/2012/12/08/…
Larry Wasserman
11
@mbq: Apenas me perguntando, por que isso foi feito no wiki da comunidade?
Mehrdad

Respostas:

9

Este exemplo é retirado daqui . (Até acho que recebi esse link da SO, mas não consigo mais encontrá-lo.)

Uma moeda foi lançada vezes, subindo cabeças vezes. Se fosse para jogar mais duas vezes, você apostaria em duas cabeças? Suponha que você não consiga ver o resultado do primeiro sorteio antes do segundo (e também independentemente de ), para que você não possa atualizar sua opinião sobre entre os dois arremessos.k = 10 θ θn=14k=10θθ

Por independência, Então, a distribuição preditiva que recebe a -prior, torna-se

f(yf,1=heads,yf,2=heads|θ)=f(yf,1=heads)f(yf,2=heads|θ)=θ2.
Beta(α0,β0) Beta(1,1)(10/14)20,51
f(yf,1=heads,yf,2=heads|y)=f(yf,1=heads,yf,2=heads|θ)π(θ|y)dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)θ2θα0+k1(1θ)β0+nk1dθ=Γ(α0+β0+n)Γ(α0+k)Γ(β0+nk)Γ(α0+k+2)Γ(β0+nk)Γ(α0+β0+n+2)=(α0+k)(α0+k+1)(α0+β0+n)(α0+β0+n+1)
Para um uniforme anterior ( aBeta(1,1)-prior), isso dá aproximadamente 0,485. Portanto, você provavelmente não apostaria. Com base no MLE 10/14, você calcularia uma probabilidade de duas cabeças de , de modo que as apostas fizessem sentido.(10/14)2.51
Christoph Hanck
fonte
+1 exatamente o tipo de resposta que eu estava procurando, obrigado.
Mehrdad 26/03
5
Na verdade, houve uma atualização na postagem mencionada na resposta ... Embora ele tenha deixado a postagem ", em vez de usar a distribuição uniforme como anterior, podemos ser ainda mais agnósticos. Nesse caso, podemos usar o Beta ( 0,0) como prévia. Essa distribuição corresponde ao caso em que qualquer média da distribuição é igualmente provável. Nesse caso, as duas abordagens Bayesiana e Frequentista apresentam os mesmos resultados. " !!! Então, ainda precisamos de um exemplo para responder a essa pergunta! Portanto, marque +1 na resposta abaixo como a verdadeira resposta a esta pergunta.
user1745038
10

Veja minha pergunta aqui , que menciona um artigo de Edwin Jaynes que fornece um exemplo de um intervalo de confiança freqüentista construído corretamente, em que há informações suficientes na amostra para saber com certeza que o verdadeiro valor da estatística não está em nenhum lugar no intervalo de confiança ( e, portanto, o intervalo de confiança é diferente do intervalo credível bayesiano).

No entanto, a razão para isso é a diferença na definição de um intervalo de confiança e um intervalo credível, que, por sua vez, é uma conseqüência direta da diferença nas definições freqüentes e bayesianas de probabilidade. Se você pedir a um bayesiano que produza um intervalo de confiança bayesiano (em vez de credível), então suspeito que sempre haverá um prioritário para o qual os intervalos serão os mesmos; portanto, as diferenças são mínimas.

Se os métodos freqüentistas ou bayesianos são apropriados depende da pergunta que você deseja formular e, no final do dia, é a diferença nas filosofias que decide a resposta (desde que o esforço computacional e analítico necessário não seja considerado).

Sendo um tanto irônico, pode-se argumentar que uma frequência de longo prazo é uma maneira perfeitamente razoável de determinar a plausibilidade relativa de uma proposição; nesse caso, as estatísticas freqüentistas são um subconjunto ligeiramente estranho do bayesianismo subjetivo - para que qualquer pergunta que um freqüentador possa responder um bayesiano subjetivista também pode responder da mesma maneira, ou de alguma outra maneira, se escolher diferentes antecedentes. ; o)

Dikran Marsupial
fonte
4
O uso de "bayesiano subjetivo" é um pouco de auto-sabotagem ( ver ). A modelagem em geral é cheia de subjetivismo, a escolha de uma distribuição para modelar uma amostra também é subjetiva. Mesmo a escolha de um teste de qualidade do ajuste para verificar se um determinado modelo é razoável é subjetiva.
2
Eu realmente não concordo com isso, se alguém considera "subjetivo" perjorativo, esse é o erro deles. Às vezes, quando queremos dizer probabilidade, realmente queremos dizer crença pessoal subjetiva - não vejo razão para não chamá-lo assim, se é isso que realmente significa (optando por aceitar apenas frequências de longo prazo, pois a definição de probabilidade é uma escolha puramente subjetiva).
Dikran Marsupial
11
+1 obrigado pelo link, é muito esclarecedor. E também para a nota sobre a diferença entre confiança e intervalos credíveis também.
Mehrdad
8

Acredito que este artigo fornece uma sensação mais propositada das compensações em aplicações reais entre os dois. Parte disso pode ser devido à minha preferência por intervalos, em vez de testes.

Gustafson, P. e Groenlândia, S. (2009). Estimativa de intervalo para dados observacionais confusos . Statistical Science 24: 328–342.

No que diz respeito aos intervalos, pode valer a pena lembrar que os intervalos de confiança freqüentes exigem / exigem cobertura uniforme (exatamente ou pelo menos superior a x% para cada valor de parâmetro que não tem probabilidade zero) e, se não tem isso - eles não são realmente intervalos de confiança. (Alguns vão mais longe e dizem que também devem descartar subconjuntos relevantes que alteram a cobertura.)

A cobertura bayesiana é geralmente definida relaxando-se que "para uma cobertura média", dado o pressuposto anterior, acaba sendo exatamente correto. Gustafson e Groenlândia (2009) chamam esses anteriores onipotentes e consideram os falíveis para fornecer uma melhor avaliação.

phaneron
fonte
11
+1 Eu nunca soube dessa diferença de restrição, obrigado por apontar.
Mehrdad
3

Se alguém colocasse uma pergunta com uma resposta freqüentista e bayesiana, suspeito que outra pessoa seria capaz de identificar uma ambiguidade na pergunta, tornando-a não "bem formada".

Em outras palavras, se você precisar de uma resposta freqüentista, use métodos freqüentes. Se você precisar de uma resposta bayesiana, use métodos bayesianos. Se você não sabe do que precisa, pode não ter definido a pergunta sem ambiguidade.

No entanto, no mundo real, muitas vezes existem várias maneiras diferentes de definir um problema ou fazer uma pergunta. Às vezes, não está claro qual dessas maneiras é preferível. Isso é especialmente comum quando o cliente é estatisticamente ingênuo. Outras vezes, uma pergunta é muito mais difícil de responder do que outra. Nesses casos, geralmente é mais fácil tentar garantir que seus clientes concordem exatamente com a pergunta que ele está fazendo ou com o que está resolvendo.

Emil Friedman
fonte
3

Eu recomendo olhar para o Exercício 3.15 do livro didático de informação, algoritmos de inferência e aprendizado da MacKay.

Quando girou no limite 250 vezes, uma moeda belga de um euro surgiu cara 140 vezes e coroa 110. "Parece muito suspeito para mim", disse Barry Blight, professor de estatística da London School of Economics. "Se a moeda fosse imparcial, a chance de obter um resultado tão extremo quanto isso seria menor que 7%". Mas esses dados evidenciam que a moeda é tendenciosa e não justa?

p0.076:1

Solha
fonte