Exemplos concretos de uma abordagem freqüentista que é superior a uma abordagem bayesiana [fechada]

8

Você pode me ajudar a entender o ponto de vista freqüentista no debate bayesiano versus freqüentador? Eu li muito e todas as fontes que encontrei são preenchidas com equações complexas ou escritas do ponto de vista bayesiano, ou ambas. Não encontrei um único problema de amostra em que a abordagem freqüentista produzisse resultados mais úteis do que a abordagem bayesiana. Sinto que só compreendo um lado deste debate e gostaria de entender o outro lado também. Como não tenho formação em estatística, aprecio exemplos simples de casos em que métodos freqüentistas produzem mais valor que métodos bayesianos.

Um bom exemplo seria um cenário de apostas em que um frequentista e um bayesiano apostam entre si sobre algum resultado futuro e o frequentista tem um valor esperado positivo.

Atte Juvonen
fonte
3
Certamente você pode encontrar algumas dezenas de milhares de exemplos apenas navegando neste site. À luz disso, apenas que tipo de respostas você está procurando?
whuber
7
Depois de 2 horas pesquisando no Google, encontrei 0 exemplos em que a abordagem freqüentista é mais útil que a bayesiana. Se você possui 10.000 exemplos, pode fornecer 1 deles? Obrigado.
Atte Juvonen
2
Não sei se é o nível que você gostaria, mas você pode encontrar uma discussão relevante no livro de L. Wasserman, que também está disponível online. read.pudn.com/downloads158/ebook/702714/… . Se você for para a página 216, encontrará um exemplo a respeito dos intervalos de confiança em que a abordagem freqüentista supera a bayesiana.
JohnK
2
@ whuber: Eu não acredito que sua definição de "útil" seja diferente da minha de uma maneira que faça sentido discutir sobre isso. Não estou aqui para inferir esse freqüentador bayesiano. Aprendi muito recentemente sobre esses assuntos e sinto que só compreendo um lado do debate. Eu gostaria de entender o outro lado também. Acho mais fácil apreender novos conceitos por meio de exemplos práticos; neste caso um exemplo onde frequentism fornece algo de valor (onde os métodos Bayesian aquém)
Atte Juvonen
3
Eu voto para reabrir. @whuber, o fato de mais de 20 mil pessoas terem chegado aqui para fazer uma pergunta sobre técnicas frequentistas e ter uma resposta útil não implica que as técnicas frequentistas fossem mais apropriadas do que as bayesianas nesses casos específicos; significa apenas que eles são generalizados.
ameba

Respostas:

7

Um bom exemplo seria um cenário de apostas em que um freqüentador e bayesiano apostam um contra o outro em algum resultado futuro e o freqüentista tem um valor esperado positivo.

Não vou dar esse exemplo, porque esse exemplo favoreceria uma abordagem bayesiana, a menos que o bayesiano escolha um prior ruim, que é um exemplo de que não vale a pena escrever sobre isso.

A abordagem mais frequente não é projetada para obter o maior valor esperado em cenários de apostas (felizmente, o mundo das estatísticas e da probabilidade é muito mais amplo do que apenas isso). Em vez disso, as técnicas freqüentistas são projetadas para garantir certas propriedades de frequência desejáveis, particularmente a de cobertura. Essas propriedades são importantes para estimativa e inferência de parâmetros no contexto de pesquisa e investigação científica.

Encorajo-vos a verificar este link aqui para um post do Dr. Larry Wasserman. Nele, ele fala sobre garantias de frequência com mais profundidade (veja os exemplos que ele dá).

Suponha que tivéssemos alguns dados e achamos que eles são distribuídos de acordo com alguma distribuição condicional (se você quiser, pode imaginar que é normalmente distribuído e é a média e \ ou variação). Como não sabemos o valor de , precisamos calculá-lo. Podemos usar uma abordagem freqüentista ou bayesiana para fazer isso.YYf(Y|θ)Yθθ

Na abordagem freqüentista, obteríamos uma estimativa pontual e um intervalo de confiança para essa estimativa. Assumindo que existe e o modelo é válido e bem comportado, o intervalo de confiança freqüentista é garantido para conter % do tempo, independentemente do que na verdade é . pode ser 0, pode ser 1.000.000, pode ser -53,2, não importa, a afirmação acima é verdadeira.θ^θ(1α)θ (1α)θθ

No entanto, o acima exposto não é válido para os intervalos de confiança bayesiana, também conhecidos como intervalos credíveis. Isso ocorre porque, em uma configuração bayesiana, precisamos especificar um e simular a partir do posterior, . Podemos formar % de intervalos credíveis usando a amostra resultante, mas a probabilidade de que esses intervalos contenham depende de quão provável está sob o nosso anterior. θπ(θ)π(θ|Y)f(Y|θ)π(θ)(1α)θθ

Em um cenário de apostas, podemos acreditar que certos valores têm menor probabilidade de serem que outros, e podemos atribuir um antes para refletir essas crenças. Se nossas crenças são precisas, a probabilidade de conter no intervalo credível é maior. É por isso que pessoas inteligentes que usam técnicas bayesianas em cenários de apostas vencem com frequência.θ θθ

Mas considere um cenário diferente, como um estudo em que você está testando o efeito da educação sobre os salários, chame-o , em um modelo de regressão. Muitos pesquisadores preferem o intervalo de confiança de a ter a propriedade de frequência da cobertura, em vez de refletir seus próprios graus de crença em relação ao efeito da educação sobre os salários.βββ

Do ponto de vista pragmático, também deve ser observado que, no meu exemplo anterior, à medida que o tamanho da amostra se aproxima do infinito, tanto o frequentista quanto o bayesiano posterior convergem para . Portanto, à medida que você obtém mais e mais dados, a diferença entre a abordagem bayesiana e a freqüentista se torna insignificante. Como a estimativa bayesiana é muitas vezes (nem sempre) mais rigorosa em termos computacionais e matematicamente do que a estimativa freqüentista, os profissionais geralmente optam por técnicas freqüentistas quando possuem conjuntos de dados "grandes". Isso é verdade mesmo quando o objetivo principal é a previsão, em oposição à estimativa / inferência de parâmetros. ¸(θ|Y)θ*θ^π(θ|Y)θ

Zachary Blumenfeld
fonte
+1, mas com relação ao seu exemplo de regressão (testando o efeito da educação sobre os salários), embora eu concorde que "muitas pesquisas" (inclusive eu!) Preferem usar procedimentos freqüentistas, há muitas pessoas, inclusive estatísticos, dizendo que isso toda a abordagem é equivocada e não funciona corretamente ou mesmo como pretendido. Este não é um lugar para debater, mas deve-se mencionar que esse ponto de vista também existe.
ameba
@amoeba, praticamente todos esses argumentos não são sobre abordagens freqüentistas usadas propriamente ditas, mas sobre o uso excessivo, mau uso e mal-entendido deles.
John
Zachary, como esse tópico está fechado, você se importaria ou preferiria se sua resposta fosse movida para stats.stackexchange.com/questions/194035 ? Isso pode ser feito se esse segmento for "mesclado" àquele (por exemplo, fechado como duplicado e todas as respostas forem movidas). Eu acho que isso poderia ser útil.
Ameba
@amoeba claro, se você acha que seria útil.
Zachary Blumenfeld /
1
"Eu não vou dar esse exemplo, porque esse exemplo favoreceria uma abordagem bayesiana, a menos que o bayesiano escolha um prior ruim, que é um exemplo de que não vale a pena escrever". Eu discordo totalmente disso. Esta é a razão fundamental para considerar as estatísticas freqüentes: em primeiro lugar, é difícil encontrar bons priores. Os resultados bayesianos são trivialmente melhores com um bom prior, mas obter um bom prior é muito pouco trivial.
Cliff AB