Costumo ouvir a afirmação de que as estatísticas bayesianas podem ser altamente subjetivas. O argumento principal é que a inferência depende da escolha de um prior (mesmo que alguém possa usar o princípio de indiferença ou entropia máxima para escolher um prior). Em comparação, afirma a alegação, as estatísticas freqüentistas são, em geral, mais objetivas. Quanta verdade existe nesta afirmação?
Além disso, isso me faz pensar:
- Quais são os elementos concretos das estatísticas freqüentistas (se houver) que podem ser particularmente subjetivos e que não estão presentes ou são menos importantes nas estatísticas bayesianas?
- A subjetividade é mais prevalente no bayesiano do que nas estatísticas freqüentistas?
bayesian
interpretation
frequentist
philosophical
Amelio Vazquez-Reina
fonte
fonte
Respostas:
Eu também. Mas observe que há uma grande ambiguidade em chamar algo de subjetivo.
Subjetividade (ambos os sentidos)
Subjetivo pode significar (pelo menos) um dos
O bayesianismo é subjetivo no segundo sentido, porque oferece sempre uma maneira de atualizar crenças representadas por distribuições de probabilidade condicionando a informação. (Observe que se essas crenças são crenças que algum sujeito realmente tem ou apenas crenças que um sujeito poderia ter é irrelevante para decidir se é 'subjetiva'.)
Na verdade, se um prior representa sua crença pessoal sobre algo, você quase certamente não a escolheu mais do que escolheu a maioria de suas crenças. E se representa as crenças de alguém, pode ser uma representação mais ou menos precisa dessas crenças; portanto, ironicamente, haverá um fato bastante "objetivo" sobre o quão bem as representa.
Pode-se, embora isso não tenda a generalizar muito suavemente para domínios contínuos. Além disso, é possível argumentar que é impossível ser simples ou 'indiferente' em todas as parametrizações de uma só vez (embora eu nunca tenha tido certeza do por que você gostaria de ser).
Então, como podemos avaliar essa afirmação?
Sugiro que, no segundo segundo sentido do subjetivo: é quase sempre correto. E no primeiro sentido do subjetivo: provavelmente é falso.
Frequentismo como subjetivo (segundo sentido)
Alguns detalhes históricos são úteis para mapear os problemas
Para Neyman e Pearson, existe apenas comportamento indutivo , não inferência indutiva e toda avaliação estatística funciona com propriedades de amostragem de longo prazo dos estimadores. (Daí a análise alfa e de potência, mas não os valores de p). Isso é bastante subjetivo nos dois sentidos.
De fato, é possível, e eu acho bastante razoável, argumentar sobre essas linhas que o Frequentismo não é realmente uma estrutura de inferência, mas uma coleção de critérios de avaliação para todos os procedimentos possíveis de inferência que enfatizam seu comportamento em aplicações repetidas. Exemplos simples seriam consistência, imparcialidade, etc. Isso o torna obviamente não-subjetivo no sentido 2. No entanto, também corre o risco de ser subjetivo no sentido 1 quando precisamos decidir o que fazer quando esses critérios não se aplicam (por exemplo, quando não há um estimador imparcial a ser obtido) ou quando eles se aplicam, mas contradizem.
Fisher ofereceu um freqüentismo menos subjetivo que é interessante. Para Fisher, existe uma inferência indutiva, no sentido de que um sujeito, o cientista, faz inferências com base em uma análise de dados, feita pelo estatístico. (Daí os valores p, mas não as análises alfa e de potência). No entanto, as decisões sobre como se comportar, se deve continuar com a pesquisa etc. são tomadas pelo cientista com base em sua compreensão da teoria dos domínios, e não pelo estatístico que aplica o paradigma da inferência. Por causa dessa divisão de trabalho dos pescadores, tanto a subjetividade (sentido 2) quanto a individual (sentido 1) estão do lado da ciência, não do lado estatístico.
Legalmente falando, o Frequentismo de Fisher é subjetivo. Só que o sujeito que é subjetivo não é o estatístico.
Existem várias sínteses disponíveis, tanto a mistura pouco coerente que você encontra nos livros de estatística aplicada quanto em versões mais diferenciadas, por exemplo, as 'Estatísticas de erro' apresentadas por Deborah Mayo. Este último é bastante subjetivo no sentido 2, mas altamente subjetivo no sentido 1, porque o pesquisador precisa usar o julgamento científico - estilo Fisher - para descobrir quais probabilidades de erro são importantes e devem ser testadas.
Frequentismo como subjetivo (primeiro sentido)
Então o Frequentismo é menos subjetivo no primeiro sentido? Depende. Qualquer procedimento de inferência pode ser repleto de idiossincrasias, como realmente aplicadas. Então, talvez seja mais útil perguntar se o freqüentismo incentiva uma abordagem menos subjetiva (primeiro sentido)? Duvido - acho que a aplicação consciente de métodos subjetivos (segundo sentido) leva a resultados menos subjetivos (primeiro sentido), mas pode ser argumentada de qualquer maneira.
Suponha por um momento que a subjetividade (primeiro sentido) entre na análise através de 'escolhas'. O bayesianismo parece envolver mais 'escolhas'. No caso mais simples, as escolhas contam como: um conjunto de suposições potencialmente idiossincráticas para o freqüentista (a função de verossimilhança ou equivalente) e dois conjuntos para o bayesiano (a verossimilhança e uma prévia sobre as incógnitas).
No entanto, os bayesianos sabem que estão sendo subjetivos (no segundo sentido) sobre todas essas opções, de modo que podem ser mais conscientes das implicações que devem levar a menos subjetividade (no primeiro sentido).
Por outro lado, se alguém procurar um teste em um grande livro de testes, poderá ter a sensação de que o resultado é menos subjetivo (primeiro sentido), mas sem dúvida isso é resultado da substituição do entendimento de algum outro sujeito do problema pelo próprio . Não está claro que alguém tenha se tornado menos subjetivo dessa maneira, mas pode parecer assim. Eu acho que a maioria concorda que isso é inútil.
fonte
A subjetividade nas abordagens freqüentistas é galopante na aplicação de inferência. Ao testar uma hipótese, você define um nível de confiança, digamos 95% ou 99%. De onde isto vem? Ele não vem de lugar nenhum, a não ser suas próprias preferências ou uma prática predominante em seu campo.
O assunto anterior bayesiano é muito pouco em grandes conjuntos de dados, porque quando você o atualiza com os dados, a distribuição posterior flutua para longe do anterior, à medida que mais e mais dados são processados.
Dito isto, os bayesianos partem da definição subjetiva de probabilidades, crenças, etc. Isso os diferencia dos frequentistas, que pensam em termos de probabilidades objetivas. Em pequenos conjuntos de dados, isso faz a diferença
ATUALIZAÇÃO: Espero que você odeie a filosofia tanto quanto eu, mas eles têm algum pensamento interessante de tempos em tempos, considere o subjetivismo . Como sei que estou realmente no SE? E se for o meu sonho? etc :)
fonte