Subjetividade nas Estatísticas Frequentistas

Costumo ouvir a afirmação de que as estatísticas bayesianas podem ser altamente subjetivas. O argumento principal é que a inferência depende da escolha de um prior (mesmo que alguém possa usar o princípio de indiferença ou entropia máxima para escolher um prior). Em comparação, afirma a alegação, as estatísticas freqüentistas são, em geral, mais objetivas. Quanta verdade existe nesta afirmação?

Além disso, isso me faz pensar:

Quais são os elementos concretos das estatísticas freqüentistas (se houver) que podem ser particularmente subjetivos e que não estão presentes ou são menos importantes nas estatísticas bayesianas?
A subjetividade é mais prevalente no bayesiano do que nas estatísticas freqüentistas?

bayesian interpretation frequentist philosophical Amelio Vazquez-Reina
fonte

Certamente os métodos freqüentistas são muito mais subjetivos do que os anunciados, mas eu argumentaria que os métodos bayesianos ainda são mais subjetivos. E por favor não se convencer de que a invariância de sua prévia no âmbito de um grupo ou a especificação de um MaxEnt antes são de alguma forma "objetiva" - os dois tipos anteriores potencialmente expressar crenças que eu considerar informativo, e de qualquer forma nem estratégia é aplicável em generalidade completa (por exemplo, não acho que existam anteriores invariantes ou MaxEnt no espaço de CDFs, e qualquer anterior neste espaço atribui a probabilidade 1 a um conjunto topologicamente escasso).

cara

Os bayesianos começam no campo subjetivo e, em seguida, os dados os levam de volta à realidade objetiva. Os freqüentistas começam (ou pelo menos pensam que sim) a partir de posições objetivas, mas acabam contaminando a análise com suas suposições subjetivas.

Aksakal

Os bayesianos sabem e são honestos com suas suposições. Frequentistas geralmente não são.

Alexis

Respostas:

Costumo ouvir a afirmação de que as estatísticas bayesianas podem ser altamente subjetivas.

Eu também. Mas observe que há uma grande ambiguidade em chamar algo de subjetivo.

Subjetividade (ambos os sentidos)

Subjetivo pode significar (pelo menos) um dos

depende das idiossincrasias do pesquisador
explicitamente preocupado com o estado de conhecimento de um indivíduo

O bayesianismo é subjetivo no segundo sentido, porque oferece sempre uma maneira de atualizar crenças representadas por distribuições de probabilidade condicionando a informação. (Observe que se essas crenças são crenças que algum sujeito realmente tem ou apenas crenças que um sujeito poderia ter é irrelevante para decidir se é 'subjetiva'.)

O argumento principal é que a inferência depende da escolha de um

Na verdade, se um prior representa sua crença pessoal sobre algo, você quase certamente não a escolheu mais do que escolheu a maioria de suas crenças. E se representa as crenças de alguém, pode ser uma representação mais ou menos precisa dessas crenças; portanto, ironicamente, haverá um fato bastante "objetivo" sobre o quão bem as representa.

(mesmo que alguém possa usar o princípio da indiferença ou entropia máxima para escolher uma prévia).

Pode-se, embora isso não tenda a generalizar muito suavemente para domínios contínuos. Além disso, é possível argumentar que é impossível ser simples ou 'indiferente' em todas as parametrizações de uma só vez (embora eu nunca tenha tido certeza do por que você gostaria de ser).

Em comparação, afirma a alegação, as estatísticas freqüentistas são, em geral, mais objetivas. Quanta verdade existe nesta afirmação?

Então, como podemos avaliar essa afirmação?

Sugiro que, no segundo segundo sentido do subjetivo: é quase sempre correto. E no primeiro sentido do subjetivo: provavelmente é falso.

Frequentismo como subjetivo (segundo sentido)

Alguns detalhes históricos são úteis para mapear os problemas

Para Neyman e Pearson, existe apenas comportamento indutivo , não inferência indutiva e toda avaliação estatística funciona com propriedades de amostragem de longo prazo dos estimadores. (Daí a análise alfa e de potência, mas não os valores de p). Isso é bastante subjetivo nos dois sentidos.

De fato, é possível, e eu acho bastante razoável, argumentar sobre essas linhas que o Frequentismo não é realmente uma estrutura de inferência, mas uma coleção de critérios de avaliação para todos os procedimentos possíveis de inferência que enfatizam seu comportamento em aplicações repetidas. Exemplos simples seriam consistência, imparcialidade, etc. Isso o torna obviamente não-subjetivo no sentido 2. No entanto, também corre o risco de ser subjetivo no sentido 1 quando precisamos decidir o que fazer quando esses critérios não se aplicam (por exemplo, quando não há um estimador imparcial a ser obtido) ou quando eles se aplicam, mas contradizem.

Fisher ofereceu um freqüentismo menos subjetivo que é interessante. Para Fisher, existe uma inferência indutiva, no sentido de que um sujeito, o cientista, faz inferências com base em uma análise de dados, feita pelo estatístico. (Daí os valores p, mas não as análises alfa e de potência). No entanto, as decisões sobre como se comportar, se deve continuar com a pesquisa etc. são tomadas pelo cientista com base em sua compreensão da teoria dos domínios, e não pelo estatístico que aplica o paradigma da inferência. Por causa dessa divisão de trabalho dos pescadores, tanto a subjetividade (sentido 2) quanto a individual (sentido 1) estão do lado da ciência, não do lado estatístico.

Legalmente falando, o Frequentismo de Fisher é subjetivo. Só que o sujeito que é subjetivo não é o estatístico.

Existem várias sínteses disponíveis, tanto a mistura pouco coerente que você encontra nos livros de estatística aplicada quanto em versões mais diferenciadas, por exemplo, as 'Estatísticas de erro' apresentadas por Deborah Mayo. Este último é bastante subjetivo no sentido 2, mas altamente subjetivo no sentido 1, porque o pesquisador precisa usar o julgamento científico - estilo Fisher - para descobrir quais probabilidades de erro são importantes e devem ser testadas.

Frequentismo como subjetivo (primeiro sentido)

Então o Frequentismo é menos subjetivo no primeiro sentido? Depende. Qualquer procedimento de inferência pode ser repleto de idiossincrasias, como realmente aplicadas. Então, talvez seja mais útil perguntar se o freqüentismo incentiva uma abordagem menos subjetiva (primeiro sentido)? Duvido - acho que a aplicação consciente de métodos subjetivos (segundo sentido) leva a resultados menos subjetivos (primeiro sentido), mas pode ser argumentada de qualquer maneira.

Suponha por um momento que a subjetividade (primeiro sentido) entre na análise através de 'escolhas'. O bayesianismo parece envolver mais 'escolhas'. No caso mais simples, as escolhas contam como: um conjunto de suposições potencialmente idiossincráticas para o freqüentista (a função de verossimilhança ou equivalente) e dois conjuntos para o bayesiano (a verossimilhança e uma prévia sobre as incógnitas).

No entanto, os bayesianos sabem que estão sendo subjetivos (no segundo sentido) sobre todas essas opções, de modo que podem ser mais conscientes das implicações que devem levar a menos subjetividade (no primeiro sentido).

Por outro lado, se alguém procurar um teste em um grande livro de testes, poderá ter a sensação de que o resultado é menos subjetivo (primeiro sentido), mas sem dúvida isso é resultado da substituição do entendimento de algum outro sujeito do problema pelo próprio . Não está claro que alguém tenha se tornado menos subjetivo dessa maneira, mas pode parecer assim. Eu acho que a maioria concorda que isso é inútil.

conjugateprior
fonte

Uma definição de dicionário de 'subjetivo' (direto do Google) diz: com base ou influenciada por sentimentos, gostos ou opiniões pessoais. por exemplo, "suas opiniões são altamente subjetivas" sinônimos: pessoal, personalizado, individual, interno, emocional, instintivo, intuitivo, impressionista . Observe que isso reflete uma teoria popular de que uma 'visão' (ou seja, uma crença) é subjetiva (sentido 1: impressionista, intuitivo, estranho etc.) porque se refere ao estado interno de um assunto em particular (sentido 2: personalizado, individual etc.) .) ao invés de ser público, isto é, impessoal .

conjugateprior

Pode ser útil pensar na psicologia cognitiva como um exemplo. Este campo é completamente subjetiva (no segundo sentido, porque é tudo sobre os estados internos de pessoas e seus efeitos sobre o comportamento dessas pessoas), mas é não subjetiva no primeiro sentido, porque os psicólogos não pode realmente apenas sentar e inventar coisas sobre a base de seu próprio estado interno.

conjugateprior

O extremo oposto, onde algo é totalmente idiossincrático e subjetivo (sentido 1), mas na verdade não é sobre assuntos , é mais difícil de encontrar. Talvez Lucrécio explicando átomos e vazio em de Rerum Naturae seja um exemplo.

conjugateprior

Exatamente. O inglês não ajuda muito ...

conjugateprior

e eu aprovei (e ajustei levemente) a alteração proposta

conjugateprior

A subjetividade nas abordagens freqüentistas é galopante na aplicação de inferência. Ao testar uma hipótese, você define um nível de confiança, digamos 95% ou 99%. De onde isto vem? Ele não vem de lugar nenhum, a não ser suas próprias preferências ou uma prática predominante em seu campo.

O assunto anterior bayesiano é muito pouco em grandes conjuntos de dados, porque quando você o atualiza com os dados, a distribuição posterior flutua para longe do anterior, à medida que mais e mais dados são processados.

Dito isto, os bayesianos partem da definição subjetiva de probabilidades, crenças, etc. Isso os diferencia dos frequentistas, que pensam em termos de probabilidades objetivas. Em pequenos conjuntos de dados, isso faz a diferença

ATUALIZAÇÃO: Espero que você odeie a filosofia tanto quanto eu, mas eles têm algum pensamento interessante de tempos em tempos, considere o subjetivismo . Como sei que estou realmente no SE? E se for o meu sonho? etc :)

Aksakal
fonte

Além da escolha de um nível de confiança no teste de hipóteses (já que o mesmo poderia ser discutido nas estatísticas bayesianas, por exemplo, ao escolher um critério para comparar o HDP / IDH com o ROPE para rejeitar ou aceitar uma hipótese ), a subjetividade desempenha um papel importante. obter uma estimativa pontual ou obter intervalos de confiança, talvez na escolha dos estimadores?

Amelio Vazquez-Reina

Além disso, meu entendimento é de que os níveis de significância são definidos nas estatísticas freqüentistas no contexto da tomada de decisão (ou seja, devemos rejeitar a hipótese nula?), E não nas probabilidades de computação. Na teoria da decisão bayesiana, o mesmo poderia ser discutido sobre a escolha de uma função Loss, que pode afetar a decisão ótima (escolhida). Além disso, os valores de nível de confiança são geralmente escolhidos a partir de uma taxa de erro aceitável tipo I (por exemplo, 95% em TEHN está directamente estabelecida a partir de um "não superior a 5% de" taxa de falsos positivos)

Amelio Vazquez-Reina

n \to \infty

$n \to \infty$

p ≪ n

$p \ll n$

p \to \infty

$p \to \infty$

n

$n$

Pode valer a pena notar que as funções de perda podem não ser subjetivas (ou seja, completamente determinadas pelo contexto); nesse caso, as decisões ótimas bayesianas têm o potencial de serem completamente objetivas, além das anteriores.

α

$\alpha$