Nota: Estou ciente das diferenças filosóficas entre as estatísticas bayesianas e as freqüentadoras.
Por exemplo, "qual é a probabilidade de a moeda na mesa ser cara" não faz sentido nas estatísticas freqüentistas, já que ela já caiu na cara ou coroa - não há nada probabilístico nela. Portanto, a pergunta não tem resposta em termos freqüentes.
Mas essa diferença não é especificamente o tipo de diferença que estou perguntando.
Em vez disso, gostaria de saber como suas previsões para perguntas bem formadas diferem realmente no mundo real, excluindo quaisquer diferenças teóricas / filosóficas, como o exemplo que mencionei acima.
Então, em outras palavras:
O que é um exemplo de uma pergunta, responde em ambos frequencista e estatística Bayesiana, cuja resposta é diferente entre os dois?
(por exemplo, talvez um deles responda "1/2" a uma pergunta em particular e o outro responda "2/3".)
Existem diferenças?
Se sim, quais são alguns exemplos?
Se não, então quando é que realmente faz diferença se eu uso estatísticas bayesianas ou freqüentistas ao resolver um problema específico?
Por que eu evitaria um em favor do outro?
fonte
Respostas:
Este exemplo é retirado daqui . (Até acho que recebi esse link da SO, mas não consigo mais encontrá-lo.)
Uma moeda foi lançada vezes, subindo cabeças vezes. Se fosse para jogar mais duas vezes, você apostaria em duas cabeças? Suponha que você não consiga ver o resultado do primeiro sorteio antes do segundo (e também independentemente de ), para que você não possa atualizar sua opinião sobre entre os dois arremessos.k = 10 θ θn=14 k=10 θ θ
Por independência, Então, a distribuição preditiva que recebe a -prior, torna-se
fonte
Veja minha pergunta aqui , que menciona um artigo de Edwin Jaynes que fornece um exemplo de um intervalo de confiança freqüentista construído corretamente, em que há informações suficientes na amostra para saber com certeza que o verdadeiro valor da estatística não está em nenhum lugar no intervalo de confiança ( e, portanto, o intervalo de confiança é diferente do intervalo credível bayesiano).
No entanto, a razão para isso é a diferença na definição de um intervalo de confiança e um intervalo credível, que, por sua vez, é uma conseqüência direta da diferença nas definições freqüentes e bayesianas de probabilidade. Se você pedir a um bayesiano que produza um intervalo de confiança bayesiano (em vez de credível), então suspeito que sempre haverá um prioritário para o qual os intervalos serão os mesmos; portanto, as diferenças são mínimas.
Se os métodos freqüentistas ou bayesianos são apropriados depende da pergunta que você deseja formular e, no final do dia, é a diferença nas filosofias que decide a resposta (desde que o esforço computacional e analítico necessário não seja considerado).
Sendo um tanto irônico, pode-se argumentar que uma frequência de longo prazo é uma maneira perfeitamente razoável de determinar a plausibilidade relativa de uma proposição; nesse caso, as estatísticas freqüentistas são um subconjunto ligeiramente estranho do bayesianismo subjetivo - para que qualquer pergunta que um freqüentador possa responder um bayesiano subjetivista também pode responder da mesma maneira, ou de alguma outra maneira, se escolher diferentes antecedentes. ; o)
fonte
Acredito que este artigo fornece uma sensação mais propositada das compensações em aplicações reais entre os dois. Parte disso pode ser devido à minha preferência por intervalos, em vez de testes.
No que diz respeito aos intervalos, pode valer a pena lembrar que os intervalos de confiança freqüentes exigem / exigem cobertura uniforme (exatamente ou pelo menos superior a x% para cada valor de parâmetro que não tem probabilidade zero) e, se não tem isso - eles não são realmente intervalos de confiança. (Alguns vão mais longe e dizem que também devem descartar subconjuntos relevantes que alteram a cobertura.)
A cobertura bayesiana é geralmente definida relaxando-se que "para uma cobertura média", dado o pressuposto anterior, acaba sendo exatamente correto. Gustafson e Groenlândia (2009) chamam esses anteriores onipotentes e consideram os falíveis para fornecer uma melhor avaliação.
fonte
Se alguém colocasse uma pergunta com uma resposta freqüentista e bayesiana, suspeito que outra pessoa seria capaz de identificar uma ambiguidade na pergunta, tornando-a não "bem formada".
Em outras palavras, se você precisar de uma resposta freqüentista, use métodos freqüentes. Se você precisar de uma resposta bayesiana, use métodos bayesianos. Se você não sabe do que precisa, pode não ter definido a pergunta sem ambiguidade.
No entanto, no mundo real, muitas vezes existem várias maneiras diferentes de definir um problema ou fazer uma pergunta. Às vezes, não está claro qual dessas maneiras é preferível. Isso é especialmente comum quando o cliente é estatisticamente ingênuo. Outras vezes, uma pergunta é muito mais difícil de responder do que outra. Nesses casos, geralmente é mais fácil tentar garantir que seus clientes concordem exatamente com a pergunta que ele está fazendo ou com o que está resolvendo.
fonte
Eu recomendo olhar para o Exercício 3.15 do livro didático de informação, algoritmos de inferência e aprendizado da MacKay.
fonte