Como estudante de física, experimentei a palestra "Por que sou bayesiano", talvez meia dúzia de vezes. É sempre a mesma coisa - o apresentador explica presunçosamente como a interpretação bayesiana é superior à interpretação freqüentista supostamente empregada pelas massas. Eles mencionam a regra de Bayes, marginalização, anteriores e posteriores.
Qual é a verdadeira história?
Existe um domínio legítimo de aplicabilidade para estatísticas freqüentistas? (Certamente na amostragem ou rolagem de um dado, muitas vezes ele deve ser aplicado?)
Existem filosofias probabilísticas úteis além de "bayesiana" e "freqüentista"?
probability
bayesian
frequentist
nibot
fonte
fonte
Respostas:
A interpretação bayesiana da probabilidade é suficiente para fins práticos. Mas mesmo dada uma interpretação bayesiana da probabilidade, há mais estatística do que probabilidade , porque o fundamento da estatística é a teoria da decisão e a teoria da decisão requer não apenas uma classe de modelos de probabilidade, mas também a especificação de um critério de otimização para uma regra de decisão. Sob os critérios de Bayes, as regras de decisão ideais podem ser obtidas através da regra de Bayes; mas muitos métodos freqüentistas são justificados sob minimax e outros critérios de decisão.
fonte
"Bayesiano" e "freqüentista" não são "filosofias probabilísticas". São escolas de pensamento e prática estatística preocupadas principalmente com a quantificação da incerteza e a tomada de decisões, embora estejam frequentemente associadas a interpretações particulares de probabilidade. Provavelmente a percepção mais comum, embora incompleta, é a da probabilidade como quantificação subjetiva da crença versus probabilidades como frequências de longo prazo. Mas mesmo estes não são realmente mutuamente exclusivos. E você pode não estar ciente disso, mas existem bayesianos declarados que não concordam com questões filosóficas específicas sobre probabilidade.
Estatísticas bayesianas e estatísticas freqüentistas também não são ortogonais. Parece que "frequentista" passou a significar "não bayesiano", mas isso está incorreto. Por exemplo, é perfeitamente razoável fazer perguntas sobre as propriedades dos estimadores bayesianos e os intervalos de confiança sob amostragem repetida. É uma falsa dicotomia perpetuada pelo menos em parte pela falta de uma definição comum dos termos bayesiano e frequentista (nós estatísticos não temos ninguém para culpar, a não ser nós mesmos por isso).
Para uma discussão divertida, pontual e ponderada, sugiro "Objeções às Estatísticas Bayesianas" de Gelman, os comentários e a tréplica, disponíveis aqui:
http://ba.stat.cmu.edu/vol03is03.php
Há até alguma discussão sobre intervalos de confiança na física IIRC. Para discussões mais aprofundadas, você pode voltar às referências aqui contidas. Se você quiser entender os princípios por trás da inferência bayesiana, sugiro o livro de Bernando & Smith, mas existem muitas outras boas referências.
fonte
Dê uma olhada neste artigo de Cosma Shalizi e Andrew Gelman sobre filosofia e bayesianismo. Gelman é um proeminente bayesiano e Shalizi um freqüentador!
Dê uma olhada também em essa curta crítica de Shalizi, onde ele aponta a necessidade de checar modelos e zombar do argumento do livro holandês usado por alguns bayesianos.
E por último, mas não menos importante, acho que, como você é físico, pode gostar deste texto , onde o autor aponta para "teoria da aprendizagem computacional" (que francamente não sei nada), que poderia ser uma alternativa ao bayesianismo , tanto quanto eu posso entender (não muito).
ps .: Se você seguir os links, especialmente o último e tiver uma opinião sobre o texto (e os discussões que se seguiram ao texto no blog do autor )
ps.2: Minha própria opinião sobre isso: esqueça a questão da probabilidade objetiva versus subjetiva, o princípio da probabilidade e o argumento sobre a necessidade de ser coerente. Os métodos bayesianos são bons quando permitem modelar bem o seu problema (por exemplo, usar um anterior para induzir posterior unimodal quando existe uma probabilidade bimodal etc.) e o mesmo se aplica aos métodos freqüentadores. Além disso, esqueça as coisas sobre os problemas com o valor-p. Quero dizer, o valor p é péssimo, mas no final são uma medida de incerteza, no espírito de como Fisher pensava nisso.
fonte
Para mim, o importante sobre o bayesianismo é que ele considera a probabilidade como tendo o mesmo significado que aplicamos intuitivamente na vida cotidiana, a saber, o grau de plausibilidade da verdade de uma proposição. Muito poucos de nós realmente usam probabilidade para significar estritamente uma frequência de longo prazo no uso diário, apenas porque estamos frequentemente interessados em eventos específicos que não têm frequência de longo prazo, por exemplo, qual é a probabilidade de que as emissões de combustíveis fósseis estejam causando mudanças climáticas significativas ? Por esse motivo, as estatísticas bayesianas são muito menos propensas a erros de interpretação do que as estatísticas freqüentistas.
O bayesianismo também possui grupos de marginalização, priorais, máximos, de transformação, etc., todos com seus usos, mas para mim o principal benefício é que a definição de probabilidade é mais apropriada para os tipos de problemas que quero abordar.
Isso não torna os estatísticos bayesianos melhores do que as estatísticas freqüentistas. Parece-me que as estatísticas freqüentistas são adequadas para problemas no controle de qualidade (onde você realiza repetidas amostragens de populações) ou onde você projetou experimentos, em vez de analisar dados pré-coletados (embora isso esteja muito além da minha experiência, portanto é apenas intuição).
Como engenheiro, é uma questão de "cavalos para percursos" e tenho os dois conjuntos de ferramentas na minha caixa de ferramentas e os uso regularmente.
fonte
Existem sistemas não-bayesianos ou filosofias de probabilidade - baconiana e pascaliana, por exemplo, se você gosta de epistemologia e filosofia da ciência, pode aproveitar os debates - caso contrário, você balança a cabeça e conclui que, de fato, a interpretação bayesiana é tudo o que existe.
Para boas discussões,
fonte