Você pode me ajudar a entender o ponto de vista freqüentista no debate bayesiano versus freqüentador? Eu li muito e todas as fontes que encontrei são preenchidas com equações complexas ou escritas do ponto de vista bayesiano, ou ambas. Não encontrei um único problema de amostra em que a abordagem freqüentista produzisse resultados mais úteis do que a abordagem bayesiana. Sinto que só compreendo um lado deste debate e gostaria de entender o outro lado também. Como não tenho formação em estatística, aprecio exemplos simples de casos em que métodos freqüentistas produzem mais valor que métodos bayesianos.
Um bom exemplo seria um cenário de apostas em que um frequentista e um bayesiano apostam entre si sobre algum resultado futuro e o frequentista tem um valor esperado positivo.
fonte
Respostas:
Não vou dar esse exemplo, porque esse exemplo favoreceria uma abordagem bayesiana, a menos que o bayesiano escolha um prior ruim, que é um exemplo de que não vale a pena escrever sobre isso.
A abordagem mais frequente não é projetada para obter o maior valor esperado em cenários de apostas (felizmente, o mundo das estatísticas e da probabilidade é muito mais amplo do que apenas isso). Em vez disso, as técnicas freqüentistas são projetadas para garantir certas propriedades de frequência desejáveis, particularmente a de cobertura. Essas propriedades são importantes para estimativa e inferência de parâmetros no contexto de pesquisa e investigação científica.
Encorajo-vos a verificar este link aqui para um post do Dr. Larry Wasserman. Nele, ele fala sobre garantias de frequência com mais profundidade (veja os exemplos que ele dá).
Suponha que tivéssemos alguns dados e achamos que eles são distribuídos de acordo com alguma distribuição condicional (se você quiser, pode imaginar que é normalmente distribuído e é a média e \ ou variação). Como não sabemos o valor de , precisamos calculá-lo. Podemos usar uma abordagem freqüentista ou bayesiana para fazer isso.Y Y∼f(Y|θ∗) Y θ∗ θ∗
Na abordagem freqüentista, obteríamos uma estimativa pontual e um intervalo de confiança para essa estimativa. Assumindo que existe e o modelo é válido e bem comportado, o intervalo de confiança freqüentista é garantido para conter % do tempo, independentemente do que na verdade é . pode ser 0, pode ser 1.000.000, pode ser -53,2, não importa, a afirmação acima é verdadeira.θ^ θ∗ (1−α) θ∗ (1−α) θ∗ θ∗
No entanto, o acima exposto não é válido para os intervalos de confiança bayesiana, também conhecidos como intervalos credíveis. Isso ocorre porque, em uma configuração bayesiana, precisamos especificar um e simular a partir do posterior, . Podemos formar % de intervalos credíveis usando a amostra resultante, mas a probabilidade de que esses intervalos contenham depende de quão provável está sob o nosso anterior.θ∼π(θ) π(θ|Y)∝f(Y|θ)π(θ) (1−α) θ∗ θ∗
Em um cenário de apostas, podemos acreditar que certos valores têm menor probabilidade de serem que outros, e podemos atribuir um antes para refletir essas crenças. Se nossas crenças são precisas, a probabilidade de conter no intervalo credível é maior. É por isso que pessoas inteligentes que usam técnicas bayesianas em cenários de apostas vencem com frequência.θ ∗θ∗ θ∗
Mas considere um cenário diferente, como um estudo em que você está testando o efeito da educação sobre os salários, chame-o , em um modelo de regressão. Muitos pesquisadores preferem o intervalo de confiança de a ter a propriedade de frequência da cobertura, em vez de refletir seus próprios graus de crença em relação ao efeito da educação sobre os salários.ββ β
Do ponto de vista pragmático, também deve ser observado que, no meu exemplo anterior, à medida que o tamanho da amostra se aproxima do infinito, tanto o frequentista quanto o bayesiano posterior convergem para . Portanto, à medida que você obtém mais e mais dados, a diferença entre a abordagem bayesiana e a freqüentista se torna insignificante. Como a estimativa bayesiana é muitas vezes (nem sempre) mais rigorosa em termos computacionais e matematicamente do que a estimativa freqüentista, os profissionais geralmente optam por técnicas freqüentistas quando possuem conjuntos de dados "grandes". Isso é verdade mesmo quando o objetivo principal é a previsão, em oposição à estimativa / inferência de parâmetros. ¸(θ|Y)θ*θ^ π(θ|Y) θ∗
fonte