Quem são freqüentadores?

55

Já tínhamos um tópico perguntando quem são bayesianos e um perguntando se os freqüentadores são bayesianos , mas não havia um tópico perguntando diretamente quem são freqüentadores ? Esta é uma pergunta que foi feita pelo @whuber como um comentário a este tópico e pede para ser respondida. Eles existem (existem frequentistas auto-identificados)? Talvez eles tenham sido inventados por bayesianos que precisavam de um bode expiatório para culpar ao criticar as estatísticas convencionais?

Meta-comentário às respostas que já foram dadas: Em contraste, as estatísticas bayesianas não sãodefinidas apenas em termos do uso do teorema de Bayes (não-bayesianos também o usam), nem sobre o uso da interpretação subjetivista da probabilidade (você não chamaria nenhum leigo dizendo coisas como "Aposto que a chance é inferior a 50:50!" ( Bayesiano) - então, podemos definir o freqüentismo apenas em termos da interpretação adotada da probabilidade? Além disso, a estatística probabilidade aplicada , então a definição de frequentismo deve ser focada apenas na interpretação da probabilidade?

Tim
fonte
10
Eu ainda gostaria de saber o que é um "Frequentista"? Vi esse termo usado como uma aparente referência a "qualquer não-bayesiano", bem como a alguém que subscreve uma filosofia freqüentista de probabilidade. Eu sei que existem muitos dos primeiros, mas não tenho certeza se existem expoentes vivos dos últimos!
whuber
9
Conte comigo como frequentista, por favor. Vamos nos unir! United seremos fortes para destruir Bayesian no portão de uma vez por todas!
Aksakal
10
@Aksakal repita o número infinito de vezes e eu considerarei isso significativo;)
Tim
5
Cuidado com quem você chama de bayesiano. Por DV Lindley "Não há ninguém menos bayesiano do que um bayesiano empírico". Muitos usuários dos chamados métodos bayesianos não são realmente bayesianos. Agora, com computadores velozes e MCMC, todos de repente são bayesianos? Para muitos, é apenas outro cálculo, como qualquer outro, não uma filosofia profunda. A população é dividida de forma desigual, e apenas entre freqüentistas e bayesianos. Que tal alguém sem educação relevante, o que são? Pode haver um grau (ou frequência) de bayesiano? Talvez diferente em diferentes dias da semana ou tipos de análise?
Mark L. Stone
10
Tim, receio que esse encadeamento possa ser afetado pela mesma confusão que alguns encadeamentos relacionados: a saber, existem métodos estatísticos freqüentista-bayesiano e interpretações de probabilidade freqüentista-bayesiano. Estas são duas questões diferentes! Qual você está perguntando? A confusão já é óbvia agora, nos comentários à resposta do @ fcop; O fcop fala sobre a definição / interpretação de probabilidade, enquanto você mencionou o OLS e trata-se de métodos estatísticos.
Ameba diz Reinstate Monica

Respostas:

35

Algumas respostas existentes falam sobre inferência estatística e outras sobre interpretação de probabilidade, e nenhuma claramente faz a distinção. O principal objetivo desta resposta é fazer essa distinção.


A palavra "frequentismo" (e "frequentista") pode se referir a DUAS COISAS DIFERENTES:

  1. Uma é a pergunta sobre qual é a definição ou a interpretação de "probabilidade". Existem múltiplas interpretações, sendo a "interpretação frequentista" uma delas. Frequentistas seriam as pessoas que aderiram a essa interpretação.

  2. Outra é a inferência estatística sobre os parâmetros do modelo com base nos dados observados. Existem abordagens bayesiana e freqüentista à inferência estatística, e os freqüentadores seriam as pessoas que preferem usar a abordagem freqüentista.

Agora vem uma especulação: acho que quase não há frequentistas do primeiro tipo (P-frequentistas) , mas existem muitos frequentistas do segundo tipo (S-frequentistas) .


Interpretação frequente da probabilidade

A questão do que é probabilidade é objeto de intenso debate em andamento com mais de 100 anos de história. Pertence à filosofia. Refiro alguém que não esteja familiarizado com este debate ao artigo Interpretações de Probabilidade na Enciclopédia de Filosofia de Stanford, que contém uma seção sobre interpretação (ões) freqüentadora (s). Outro relato muito legível que eu conheço é este artigo: Appleby, 2004, Probability é um caso único ou nada - que é escrito no contexto dos fundamentos da mecânica quântica, mas contém seções com foco no que é probabilidade.

Appleby escreve:

Frequentismo é a posição de que uma declaração de probabilidade é equivalente a uma declaração de frequência sobre algum conjunto adequadamente escolhido. Por exemplo, de acordo com von Mises [21, 22], a afirmação "a probabilidade desta moeda subir cara é 0,5" é equivalente à afirmação "em uma sequência infinita de lançamentos, essa moeda vai aparecer cara com frequência relativa limitada 0,5" .

Isso pode parecer razoável, mas há tantos problemas filosóficos com essa definição que mal se sabe por onde começar. Qual a probabilidade de chover amanhã? Pergunta sem sentido, porque como teríamos uma sequência infinita de tentativas. Qual é a probabilidade da moeda no meu bolso aparecer cara? Uma frequência relativa de cabeças em uma sequência infinita de lançamentos, você diz? Mas a moeda se desgastará e o Sol se tornará supernova antes que a sequência infinita possa ser concluída. Portanto, deveríamos estar falando sobre uma sequência infinita hipotética . Isso leva à discussão de classes de referência etc. etc. Na filosofia, não se foge tão facilmente. E, a propósito, por que o limite deveria existir?

Além disso, e se minha moeda aparecesse cara 50% do tempo durante o primeiro bilhão de anos, mas depois começasse a aparecer cara apenas 25% do tempo (pensamento de Appleby)? Isso significa que por definição. Mas sempre estaremos observando durante os próximos bilhões de anos. Você acha que essa situação não é realmente possível? Claro, mas por quê? Porque o não pode mudar repentinamente? Mas essa frase não tem sentido para um P-frequentista.F r e q u o e n c y ( H um e um d s ) 1 / 2 P ( H um e um d s )P(Heads)=1/4Frequency(Heads)1/2P(Heads)

Eu quero manter esta resposta curta, então paro aqui; veja acima para as referências. Eu acho realmente difícil ser um P-freqüentador obstinado.

(Atualização: nos comentários abaixo, @mpiktas insiste que é porque a definição frequentista é matematicamente sem sentido. Minha opinião expressa acima é antes que a definição frequentista é filosoficamente problemática.)


Abordagem freqüentista das estatísticas

Considere um modelo probabilístico que tem alguns parâmetros e permite calcular a probabilidade de observar os dados . Você fez um experimento e observou alguns dados . O que você pode dizer sobre ?θ X X θP(Xθ)θXXθ

S-frequentism é a posição que não é uma variável aleatória; seus verdadeiros valores no mundo real são o que são. Podemos tentar calculá-los como alguns , mas não podemos falar significativamente sobre a probabilidade de estar em algum intervalo (por exemplo, ser positivo). A única coisa que podemos fazer é criar um procedimento para construir algum intervalo em torno de nossa estimativa, de modo que esse procedimento consiga englobar verdadeiro com uma frequência específica de sucesso a longo prazo (probabilidade específica).q q qθθ^θθ

A maioria das estatísticas usadas nas ciências naturais hoje é baseada nessa abordagem, então certamente existem muitos S-frequentistas hoje.

(Atualização: se você procurar um exemplo de filósofo da estatística, em oposição a praticantes da estatística, defendendo o ponto de vista freqüentador S, leia os escritos de Deborah Mayo; +1 à resposta do @ NRH.)


ATUALIZAÇÃO: Sobre a relação entre P-frequentismo e S-frequentismo

@fcop e outros perguntam sobre a relação entre P-frequentismo e S-frequentismo. Uma dessas posições implica outra? Não há dúvida de que historicamente o S-frequentismo foi desenvolvido com base na postura P-frequentista; mas eles implicam logicamente um ao outro?

Antes de abordar esta questão, devo dizer o seguinte. Quando escrevi acima que quase não há P-frequentistas, não quis dizer que quase todo mundo é P-subjetivo-bayesiano-à-de-finetti ou P-propensitista-à-la-popper. De fato, acredito que a maioria dos estatísticos (ou cientistas de dados ou aprendizes de máquinas) são P-nada, ou P-calem-se-e-calculam (para emprestar a famosa frase de Mermin ). A maioria das pessoas costuma ignorar problemas de fundação. E tudo bem. Não temos uma boa definição de livre-arbítrio, inteligência, tempo ou amor. Mas isso não deve impedir-nos de trabalhar na neurociência, na IA, na física ou em nos apaixonar.

Pessoalmente, eu não sou um S-frequencista, mas também não tenho qualquer visão coerente sobre fundações de probabilidade.

Por outro lado, quase todo mundo que fez alguma análise estatística prática é um S-frequentista ou um S-Bayesiano (ou talvez uma mistura). Pessoalmente, publiquei artigos contendo valores- e nunca (até agora) publiquei artigos contendo anteriores e posteriores sobre os parâmetros do modelo, o que me torna um freqüentador S, pelo menos na prática.p

Portanto, é claramente possível ser um freqüentador S sem ser um freqüentador P, apesar do que @fcop diz em sua resposta.

OK. Bem. Mas ainda assim: um P-bayesiano pode ser um S-frequentista? E um P-frequentista pode ser um S-bayesiano?

Para um P-bayesiano convencido, é provavelmente atípico ser um S-freqüentista, mas em princípio inteiramente possível. Por exemplo, um P-bayesiano pode decidir que não possui nenhuma informação anterior sobre e, portanto, adotar uma análise S-frequentista. Por que não. Toda alegação S-freqüentista certamente pode ser interpretada com a interpretação P-bayesiana da probabilidade.θ

Para um P-frequentista convencido ser S-bayesiano é provavelmente problemático. Mas então é muito problemático ser um P-frequentista convencido ...

ameba diz Restabelecer Monica
fonte
2
Comentários não são para discussão prolongada; esta conversa foi movida para o bate-papo .
Glen_b
13

O trabalho de Kolmogorov sobre Fundamentos da Teoria da Probabilidade tem a seção chamada "Relação com Dados Experimentais" na p.3. Isto é o que ele escreveu lá:

insira a descrição da imagem aqui

insira a descrição da imagem aqui

Ele está mostrando como alguém poderia deduzir seus axiomas observando experimentos. Essa é uma maneira bastante frequente de interpretar as probabilidades.

Ele tem outra citação interessante para eventos impossíveis (conjuntos vazios):

insira a descrição da imagem aqui

Então, acho que se você se sente confortável com esses argumentos, deve admitir que é um freqüentador. Este rótulo não é exclusivo. Você pode ser bi-paradigmático (eu inventei a palavra), isto é, tanto freqüentista quanto bayesiano. Por exemplo, eu me torno bayesiano ao aplicar métodos estocásticos a fenômenos que não são inerentemente estocásticos.

ATUALIZAÇÃO Como escrevi anteriormente no CV, a própria teoria de Kolmogorov não é freqüentista em si. É tão compatível com a visão bayesiana quanto com a visão frequentista. Ele colocou esta nota de rodapé fofa na seção para deixar bem claro que está se abstendo da filosofia:

insira a descrição da imagem aqui

Aksakal
fonte
11
bem, a maioria dos sistemas axiomáticos são derivados de conceitos do "mundo abstrato" ou "generalização". O mesmo vale para o conceito (axiomas) de uma '' métrica '', eles analisaram o conceito do mundo real (distância eucildeana) e '' encontraram '' três propriedades que eles usaram como '' axiomas '' em um espaço métrico. Mas sua resposta é boa (+1), mostra que Kolmogorov não '' inventou '' seus axiomas '' fora do ar '', ele desenvolveu um sistema axiomático que estava vinculado à compreensão de qual era a propabilidade naquele momento .
11
Você poderia olhar os comentários de @mpiktas nesta pergunta e dizer que o próprio Kolmogorov deu essa definição? veja comentários em stats.stackexchange.com/questions/230415/…
2
@fcop, lembro da resposta dele. Parecia razoável. Definitivamente, você pode derivar axiomas de Bayes, e Kolmogorov mostra isso no livro.
Aksakal
11
+1 Exatamente o que eu tinha em mente (nota de rodapé, em particular) quando escrevia comentários em tópicos relacionados. Também último comentário de @Aksakal.
Graeme Walsh
11
@Aksakal: referindo-se a seu comentário acima: não era '' seu '' resposta, mas o meu :-)
8

Acredito que seja relevante mencionar Deborah Mayo, que escreve o blog Error Statistics Philosophy .

Não pretendo ter um entendimento profundo de sua posição filosófica, mas a estrutura das estatísticas de erros , conforme descrito em um artigo com Aris Spanos, inclui o que é considerado como métodos estatísticos freqüentadores clássicos. Para citar o artigo:

Sob a égide dos métodos estatísticos de erro, pode-se incluir todos os métodos padrão, usando probabilidades de erro baseadas nas frequências relativas de erros em amostragens repetidas - freqüentemente chamadas de teoria de amostragem ou estatística freqüentista .

E mais abaixo, no mesmo artigo, você pode ler o seguinte:

Para o erro, a probabilidade do estatístico surge não para medir graus de confirmação ou crença (real ou racional) em hipóteses, mas para quantificar com que frequência os métodos são capazes de discriminar entre hipóteses alternativas e com que confiabilidade eles facilitam a detecção de erros.

NRH
fonte
2
+1, Muito bem, mencionando o blog de Mayo. Ela é realmente a filósofa mais vocal da estatística que apóia a estatística freqüentista. A maioria dos outros protestos na internet hoje em dia é a favor das estatísticas bayesianas.
Ameba diz Reinstate Monica
6

Referindo-me a esta discussão e aos comentários sobre ela, acho que os frequentistas são aqueles que definem '' probabilidade '' de um evento como a frequência relativa de longo prazo da ocorrência desse evento. Portanto, se é o número de experimentos e o número de ocorrências do evento , a probabilidade do evento , denotada por , é definida como .nnAAAP(A)

P(A):=limn+nAn

Não é difícil ver que essa definição preenche os axiomas de Kolmogorov (porque assumir limites é linear, veja também Existe alguma base * matemática * para o debate bayesiano versus freqüentador? ).

Para dar essa definição, eles devem "acreditar" que esse limite existe. Portanto, os freqüentadores são aqueles que acreditam na existência desse limite.

EDIT em 31/8/2016: sobre a distinção entre S e P-frequentismo

Como @amoeba distingue em sua resposta entre S-frequentists e P-frequentists, onde P-frequentists são o tipo de frequentistas que eu defino supra, e como ele também argumenta que é difícil ser um P-frequentist , adicionei uma seção EDIT argumentar que o oposto é verdadeiro;

Argumento que todos os S-frequentistas são P-frequentistas .

Na seção S-frequentism, @amoeba diz : "este procedimento consegue englobar verdadeiro com uma frequência de sucesso de longo prazo (probabilidade específica)".θ

Em sua resposta, ele também afirma que os P-frequentistas são uma espécie rara.

Mas essa "frequência de sucesso a longo prazo", usada para definir o S-frequentismo, é o que ele define como P-frequentismo, pois é a interpretação de .P(CI^θ)

Portanto, de acordo com suas definições, todo freqüentador S também é um freqüentador P. Portanto, concluo que os freqüentadores-P não são tão raros quanto argumentam as amebas.

Há ainda mais; @amoeba também argumenta que os freqüentadores-S consideram o parâmetro desconhecido como fixo ou não aleatório, portanto, não se pode falar em '' probabilidade de ter um valor particluar '', ele diz queθθθ

"A única coisa que podemos fazer é criar um procedimento para construir algum intervalo em torno de nossa estimativa, de modo que esse procedimento consiga englobar verdadeiro com uma frequência de sucesso de longo prazo (probabilidade específica)".θ

Posso perguntar qual pode ser a origem do nome '' frequentista '': (a) a ideia '' não aleatória '' ou (b) a 'frequência de longo prazo' - idéia?θ

Posso também perguntar ao @mpiktas que escreve em seu comentário a resposta da ameba:

"É muito difícil ser um P-frequentista, porque é praticamente impossível dar uma definição matematicamente sólida de tal probabilidade"

Se você precisa de uma definição de P-frequentismo para definir o S-frequentismo, como alguém pode ser mais S-frequentista do que P-frequentista?

Comunidade
fonte
3
@ Tim: por que o OLS seria '' frequentista ''?
2
Nesse caso, toda a discussão sobre quem é freqüentador parece não ter muito sentido, pois seu escopo de interesse é muito limitado e enormes áreas de estatística estão fora de seu escopo ... (Incluindo muitas áreas de interesse de Bayesianos.) O que estou dizendo é que essa não parece ser a definição, pois é muito estreita.
Tim
2
O que os bayesianos (autoproclamados ou meramente pragmáticos que usam seu "chapéu bayesiano" para o interlúdio) acreditam que ? limn+nAn
Silverfish
11
@Silverfish Bayesianos são livres para usar frequências de longo prazo como probabilidades, se assim o desejarem, são apenas os freqüentadores que não têm opção. A principal diferença é que um bayesiano pode dizer que , mas em inferência, estamos interessados ​​em definir uma distribuição sobre os valores plausíveis de que obtemos das observações do 1E12. limn+nA/npHlimn+nA/npH
Dikran Marsupial 30/08/16
3
fundamento da teoria das probabilidades justamente por esse motivo, ou seja, para fornecer certas interpretações da probabilidade, som de fundo matemático. Agora você quer voltar e "reinventar" a probabilidade com sua definição "freqüentista". Eu acho isso enganoso, por isso eu voto negativo suas respostas. Você pode ignorar isso, é assim que o site funciona, sempre há possibilidade de desacordo.
Mkttas #
4

Pergunta realmente interessante!

Eu me colocaria no campo dos freqüentadores quando se trata de entender e interpretar declarações de probabilidade, embora não seja tão sincero quanto à necessidade de uma sequência real de experimentos de IID para fundamentar essa probabilidade. Suspeito que a maioria das pessoas que não compra a tese de que "probabilidade é uma medida subjetiva de crença" também pensaria em probabilidade dessa maneira.

Aqui está o que eu quero dizer: pegue nossa moeda "justa" usual, com a atribuição . Quando ouço isso, formo a imagem de alguém jogando essa moeda várias vezes e a fração de cabeças se aproxima de . Agora, se pressionado, eu também diria que a fração de cabeças em qualquer amostra aleatória de uma sequência finita de tais lançamentos de moedas também se aproximará de medida que o tamanho da amostra aumenta (suposição de independência).P(H)=0.50.50.5

Como já foi afirmado por outros, a maior suposição é que esse limite existe e está correto (ou seja, o limite é ), mas acho tão importante quanto a suposição de que o mesmo limite existe para as subamostras escolhidas aleatoriamente. Caso contrário, nossa interpretação tem significado para toda a sequência infinita (por exemplo, poderíamos ter uma forte autocorrelação que é calculada em média).0.5

Eu acho que o exposto acima é bastante incontroverso para os freqüentadores. Um bayesiano estaria mais focado no experimento em questão e menos no comportamento de longo prazo: eles afirmariam que seu grau de crença de que o próximo lançamento será cara é ... ponto final.P(H)=0.5

Para um caso simples, como o lançamento de moedas, podemos ver que as abordagens freqüentista e bayesiana são funcionalmente equivalentes, embora filosoficamente muito diferentes. Como Dikran Marsupial apontou, o bayesiano pode, de fato, estar utilizando o fato de que empiricamente vemos moedas surgindo cara tantas vezes quanto as vemos subindo coroa (longo prazo / grande frequência de amostra como anterior).

E as coisas que não podem ter frequências de longo prazo? Por exemplo, qual é a probabilidade da Coréia do Norte iniciar uma guerra com o Japão nos próximos 10 anos? Para os freqüentadores, somos realmente deixados de lado, uma vez que não podemos realmente descrever as distribuições de amostragem necessárias para testar tal hipótese. Um bayesiano seria capaz de resolver esse problema colocando a distribuição de probabilidade sobre as possibilidades, provavelmente com base na obtenção de informações de especialistas.

No entanto, surge uma pergunta-chave: de onde vêm esses graus de crença (ou valor assumido para a frequência de longo prazo)? Eu argumentaria com a psicologia e diria que essas crenças (especialmente em áreas distantes dos dados experimentais) provêm do que é chamado de heurística de disponibilidade e heurística de representatividade . Há muitos outros que provavelmente entram em cena. Argumento isso porque, na ausência de dados para calibrar nossas crenças (em relação à frequência de longo prazo observada!), Devemos confiar nas heurísticas, por mais sofisticadas que pareçam.

O pensamento heurístico mental acima se aplica igualmente aos freqüentistas e bayesianos. O que é interessante para mim é que, independentemente da nossa filosofia, na raiz, depositamos mais crença em algo que achamos que é mais provável que seja verdade, e acreditamos que seja mais provável que seja verdade porque acreditamos que há mais maneiras para que seja verdade, ou imaginamos que os caminhos que levam a isso aconteceriam com mais freqüência (com freqüência :-) do que aqueles que a tornariam verdadeira.

Como se trata de um ano eleitoral, vamos dar um exemplo político: que crença colocaríamos na declaração "Ted Cruz proporá uma espingarda de assalto proibida nos próximos 4 anos". Agora, temos alguns dados sobre isso de suas próprias declarações e provavelmente colocaríamos nossa crença anterior na verdade dessa afirmação muito próxima de zero. Mas por que? Por que suas declarações anteriores nos fazem pensar dessa maneira? Porque pensamos que pessoas altamente ideológicas tendem a "se apegar mais às armas" do que a seus colegas pragmatistas. De onde isto vem? Provavelmente dos estudos realizados por psicólogos e de nossas próprias experiências com pessoas altamente baseadas em princípios.

Em outras palavras, temos alguns dados e a crença de que, na maioria dos casos em que alguém como Cruz poderia mudar de idéia, eles não o farão (novamente, uma espécie de avaliação de longo prazo ou de amostra grande).

É por isso que eu "caucus" com os freqüentadores. Não é minha aversão à filosofia bayesiana (bastante razoável) ou aos métodos (eles são ótimos!), Mas se eu me aprofundar o suficiente em por que tenho crenças que carecem de forte apoio de amostras grandes, acho que estou confiando em algum tipo do modelo mental em que os resultados podem ser computados (se implicitamente) ou onde eu posso invocar probabilidades de longo prazo em um subprocesso específico (por exemplo, republicanos votam contra medidas de controle de armas X% do tempo) para ponderar minha crença de uma maneira ou de outra .

Certamente, esse não é um freqüentismo realmente verdadeiro, e duvido que existam muitas pessoas que subscrevam a interpretação da probabilidade de Von Mieses. No entanto, acho que mostra a compatibilidade subjacente entre as probabilidades bayesiana e frequentista: ambas apelam para nossas heurísticas internas sobre disponibilidade ou o que chamo de princípio "Pachinko" sobre frequências ao longo de uma cadeia de causalidade.

Portanto, talvez eu deva me chamar de "disponibilista", para indicar que atribuo probabilidades com base na frequência com que consigo imaginar um evento ocorrendo como resultado de uma cadeia de eventos (com algum rigor / modelagem, é claro). Se eu tenho muitos dados, ótimo. Caso contrário, tentarei decompor a hipótese em uma cadeia de eventos e usar os dados que tenho (anedótico ou "senso comum", conforme necessário)) para avaliar com que frequência eu imagino que esse evento ocorra.

Desculpe pelo post longo, ótima pergunta BTW!


fonte
11
Você faz grandes simplificações demais sobre a abordagem subjetivista da probabilidade. Concordo que a psicologia desempenha um papel importante na maneira como você trabalha com dados, mas você também pode fazer análises subjetivamente tendenciosas na abordagem freqüentista. Alguns bayesianos argumentam que, no caso bayesiano, pelo menos você torna explícitas suas crenças subjetivas, em vez de ignorá-las.
Tim
11
@ Tim Não estava dizendo que os freqüentistas são mais objetivos. , ou quantas coisas precisam acontecer (e sua probabilidade individual de fazê-lo) para tornar algo real.
11
@ Tim, já que este não é um Post sobre Bayesianismo vs Frequentismo em si, duvido que tenha dado o devido devido ... isso ocuparia muito espaço na página! Fundamentalmente, todos nós confiamos nas heurísticas mentais quando pensamos em probabilidade, e essas heurísticas nos levam a pensar em alguns tipos de eventos que podem acontecer "de mais maneiras" ou "mais acessíveis em uma rede causal" do que outros.
11
@ Tim Ok ... Eu adicionei algumas linguagens para esclarecer quando faço a transição da minha (breve) discussão sobre o bayesianismo para o meu discurso principal.
4

Como @amoeba notou, temos uma definição freqüente de probabilidade e estatísticas freqüentes . Todas as fontes que eu vi até agora dizem que a inferência freqüentista é baseada na definição freqüente de probabilidade, ou seja, entendendo-a como limite em proporção, dada a quantidade infinita de sorteios aleatórios (como já observado por @fcop e @Aksakal citando Kolmogorov)

P(A)=limnnAn

Então, basicamente, existe uma noção de alguma população da qual podemos amostrar repetidamente. A mesma idéia é usada na inferência freqüentista. Analisei alguns artigos clássicos, por exemplo, de Jerzy Neyman , para rastrear os fundamentos teóricos das estatísticas freqüentistas. Em 1937, Neyman escreveu

( ia ) O estatístico preocupa-se com uma população, , que por um motivo ou outro não pode ser estudada exaustivamente. Só é possível coletar uma amostra dessa população que possa ser estudada em detalhes e usada para formar uma opinião quanto aos valores de certas constantes que descrevem as propriedades da população . Por exemplo, pode ser desejável calcular aproximadamente a média de um certo caráter possuído pelos indivíduos que formam a população etc. ( ibπ π ππππ
) Em alternativa, o estatístico pode estar preocupado com determinadas experiências que, se repetidas em condições aparentemente idênticas, produzem resultados variados. Tais experimentos são chamados experimentos aleatórios [...]
Nos dois casos descritos, o problema com o qual o estatístico é confrontado é o problema de estimativa. Esse problema consiste em determinar quais operações aritméticas devem ser executadas nos dados observacionais para obter um resultado, a ser chamado de estimativa, que presumivelmente não difere muito do valor real do caractere numérico, seja da população , como em ( ia ), ou das experiências aleatórias, como em ( ib ). [...] Em ( iaπ
) falamos de um estatístico que extrai uma amostra da população estudada.

Em outro artigo (Neyman, 1977), ele observa que as evidências fornecidas nos dados precisam ser verificadas pela observação da natureza repetida do fenômeno estudado:

Normalmente, a 'verificação' ou 'validação' de um modelo calculado consiste em deduzir algumas de suas conseqüências freqüentes em situações não previamente estudadas empiricamente e, em seguida, na realização de experimentos apropriados para verificar se seus resultados são consistentes com as previsões. Muito geralmente, a primeira tentativa de verificação é negativa: as frequências observadas dos vários resultados do experimento discordam do modelo. No entanto, em algumas ocasiões de sorte, há um acordo razoável e a satisfação de ter "entendido" o fenômeno, pelo menos de uma maneira geral. Posteriormente, invariavelmente, novos achados empíricos aparecem, indicando a inadequação do modelo original e exigindo seu abandono ou modificação. E esta é a história da ciência!

e em outro artigo Neyman e Pearson (1933) escrevem sobre amostras aleatórias retiradas de população fixa

Na prática estatística comum, quando os fatos observados são descritos como "amostras" e as hipóteses dizem respeito às "populações", para as quais as amostras foram coletadas, os caracteres das amostras ou, como as denominamos critérios, que foram usado para testar hipóteses, parece frequentemente ser corrigido por uma intuição feliz.

As estatísticas freqüentistas nesse contexto formalizam o raciocínio científico onde as evidências são reunidas; em seguida, novas amostras são coletadas para verificar os achados iniciais e, à medida que acumulamos mais evidências, nosso estado de conhecimento se cristaliza. Novamente, conforme descrito por Neyman (1977), o processo segue as seguintes etapas

( i ) Estabelecimento empírico de frequências relativas de longo prazo aparentemente estáveis ​​(ou 'frequências' para abreviar) de eventos julgados interessantes, à medida que se desenvolvem na natureza.
( ii ) Adivinhar e depois verificar o 'mecanismo do acaso', cuja operação repetida produz as frequências observadas. Este é um problema da "teoria freqüente das probabilidades". Ocasionalmente, esta etapa é chamada de 'construção de modelo'. Naturalmente, o mecanismo do acaso é hipotético.
( iii ) Utilizando o mecanismo de chance hipotético do fenômeno estudado para deduzir regras de ajuste de nossas ações (ou 'decisões') às observações, a fim de garantir a maior 'medida' de 'sucesso'. [... das 'regras de ajuste de nossas ações' é um problema da matemática, especificamente da estatística matemática.

Os freqüentistas planejam suas pesquisas tendo em mente a natureza aleatória dos dados e a idéia de repetidos sorteios de uma população fixa, projetam seus métodos com base neles e os utilizam para verificar seus resultados (Neyman e Pearson, 1933),

Sem esperar saber se cada hipótese separada é verdadeira ou falsa, podemos procurar regras para governar nosso comportamento com relação a elas, seguindo as quais garantimos que, a longo prazo da experiência, não estaremos errados com muita frequência.

Isso está ligado ao princípio de amostragem repetida (Cox e Hinkley, 1974):

(ii) Princípio da amostragem repetida forte
De acordo com o princípio da amostragem repetida forte, os procedimentos estatísticos devem ser avaliados pelo seu comportamento em repetições hipotéticas nas mesmas condições. Isso tem duas facetas. Medidas de incerteza devem ser interpretadas como frequências hipotéticas em repetições de longo prazo; critérios de otimização devem ser formulados em termos de comportamento sensível em repetições hipotéticas.
O argumento para isso é que ele garante um significado físico para as quantidades que calculamos e que garante uma estreita relação entre a análise que fazemos e o modelo subjacente que é considerado como representando o "verdadeiro" estado de coisas.

(iii) Fraco princípio de amostragem repetida
A versão fraca do princípio de amostragem repetida exige que não sigamos procedimentos que, para alguns possíveis valores de parâmetros, dariam, em repetições hipotéticas, conclusões enganosas na maioria das vezes.

Por outro lado, ao usar a máxima probabilidade, estamos preocupados com a amostra que possuímos e, no caso bayesiano, fazemos inferência com base na amostra e em nossos antecedentes e, à medida que novos dados aparecem, podemos realizar a atualização bayesiana. Nos dois casos, a ideia de amostragem repetida não é crucial. Os freqüentistas confiam apenas nos dados que possuem (como observado pelo @WBT ), mas lembrando que é algo aleatório e deve ser pensado como parte do processo de amostragem repetida da população (lembre-se, por exemplo, de como a confiança intervalos são definidos).

No caso frequentista, a ideia de amostragem repetida nos permite quantificar a incerteza (em estatística) e nos permite interpretar os eventos da vida real em termos de probabilidade .


Como nota lateral, observe que nem Neyman (Lehmann, 1988), nem Pearson (Mayo, 1992) eram tão freqüentadores puros quanto poderíamos imaginar. Por exemplo, Neyman (1977) propõe o uso empírico bayesiano e máxima verossimilhança para estimativa de pontos. Por outro lado (Mayo, 1992),

na resposta de Pearson (1955) a Fisher (e em outras partes de seu trabalho) é que, para contextos científicos, Pearson rejeita a lógica da probabilidade de erro de longo prazo baixa [...]

Portanto, parece difícil encontrar freqüentadores puros, mesmo entre os pais fundadores.


Neyman, J. e Pearson, ES (1933). Sobre o problema dos testes mais eficientes de hipóteses estatísticas. Transações Filosóficas da Sociedade Real A: Ciências Matemáticas, Físicas e de Engenharia. 231 (694–706): 289–337.

Neyman, J. (1937). Esboço de uma teoria da estimativa estatística baseada na teoria clássica da probabilidade. Phil. Trans. R. Soc. Lond. A. 236: 333–380.

Neyman, J. (1977). Probabilidade freqüentista e estatística freqüentista. Synthese, 36 (1), 97-131.

Mayo, DG (1992). Pearson rejeitou a filosofia estatística de Neyman-Pearson? Synthese, 90 (2), 233-262.

Cox, DR e Hinkley, DV (1974). Estatística Teórica. Chapman e Hall.

Lehmann, E. (1988). Jerzy Neyman, 1894 - 1981. Relatório Técnico No. 155. Departamento de Estatística, Universidade da Califórnia.

Tim
fonte
11
+1 (já há alguns dias). Obrigado por escrever isso, existem algumas boas citações aqui e a lista de referências é muito útil. Por sua vez, atualizei minha resposta em vários lugares, mas principalmente no final, para esclarecer a relação entre P e S-frequentismo como eu a vejo. Certamente concordo que historicamente o S-freq foi construído com base nas idéias do P-freq, como você argumenta aqui, mas não acho que elas necessariamente se envolvam.
Ameba diz Restabelecer Monica
4

Deixe-me oferecer uma resposta que conecte esta pergunta a uma questão de importância atual e muito prática - Medicina de Precisão - e ao mesmo tempo responda literalmente como foi perguntado: Quem são os freqüentadores?

Frequentistas são pessoas que dizem coisas como [1] (grifo meu):

O que significa um risco de 10% de um evento na próxima década para o indivíduo para quem foi gerado? Ao contrário do que se pensa, esse nível de risco não é o risco pessoal dessa pessoa, porque a probabilidade não é significativa em um contexto individual .

Assim, os freqüentadores interpretam 'probabilidade' de tal maneira que não tem significado em um contexto singular como o de um paciente individual . Meu comentário do PubMed Commons [1] examina as contorções que seus autores freqüentadores devem sofrer para recuperar uma aparência de uma noção de probabilidade aplicável ao atendimento de um paciente individual. Observar como e por que eles fazem isso pode ser muito instrutivo sobre quem é freqüentador . Além disso, a grande parte un iluminante subsequente troca no JAMA secção Letters [2,3] é instrutiva quanto à importância de reconhecer as limitações explicitamente em noções frequentistas de probabilidade e atacá-los directamenteassim sendo. (Lamento que muitos usuários de CV possam achar que [1] está por trás de um paywall.)

O excelente e altamente legível livro [4] de L. Jonathan Cohen retribuiria os esforços de qualquer pessoa interessada na pergunta do OP. De notar, o livro de Cohen estranhamente foi citado por [1] em conexão com a afirmação "probabilidade não é significativa em um contexto individual", embora Cohen claramente repreenda essa visão da seguinte maneira [4, p49]:

Também não está aberto a um teórico da frequência afirmar que todas as probabilidades importantes são de fato gerais, não singulares. Muitas vezes, parece muito importante poder calcular a probabilidade de sucesso da apendicectomia de seu próprio filho ...


1] Sniderman AD, D'Agostino Sr RB e Pencina MJ. "O papel dos médicos na era da análise preditiva". JAMA 314, n. 1 (7 de julho de 2015): 25–26. doi: 10.1001 / jama.2015.6177. PubMed

2] Van Calster B, Steyerberg EW e Harrell FH. “Risco de previsão para indivíduos.” JAMA 314, n. 17 (3 de novembro de 2015): 1875-1875. doi: 10.1001 / jama.2015.12215. Texto completo

3] Sniderman AD, D'Agostino Sr RB e Pencina MJ. “Reveja a previsão para indivíduos - responda.” JAMA 314, n. 17 (3 de novembro de 2015): 1875-1876. doi: 10.1001 / jama.2015.12221. Texto completo

4] Cohen, L. Jonathan. Uma Introdução à Filosofia da Indução e Probabilidade. Oxford: Nova York: Clarendon Press; Oxford University Press, 1989. Link para as páginas digitalizadas 46-53 e 81-83

David C. Norris
fonte
11
2] está disponível online: lirias.kuleuven.be/bitstream/123456789/513795/1/…
Tim
Gosto da citação "o risco pode ser pensado como o nível subjetivo no qual alguém" acredita "ou está" preparado para apostar "na ocorrência de uma doença ou evento, 2 assim como se aposta em futuros eventos únicos em jogos de esporte ". Obrigado pela sua contribuição e referências.
Tim
2
Parece uma boa resposta, mas estou um pouco confusa. Acredito que os freqüentadores estão preocupados com procedimentos (experimentos) que poderiam, em teoria, ser executados um número infinito de vezes. Isso não significa que eles não podem fazer uma previsão sobre o próximo sorteio, apenas que suas preocupações / garantias se concentram no processo. É verdade que eles diriam que "os EUA vencerão a Copa do Mundo este ano" não é algo sobre o que eles poderiam dizer, mas não poderiam dizer algo sobre a apendicectomia de seu filho - é único em um sentido único, mas apendicectomias em filhos não são.
Wayne
@ Tim, obrigado pelo link, que inclui [2] e [3]. Atualizei o texto da minha resposta em conformidade.
David C. Norris
2
@Wayne, eu sugeriria que a resposta da ameba acima - com sua distinção entre procedimentos estatísticos habitualmente associados à 'visão de frequência da probabilidade' e à própria visão de frequência - responde ao seu comentário. As pessoas podem usar procedimentos estatísticos freqüentistas e, ainda assim, interpretar e usar as probabilidades resultantes de maneira fiducial ou subjetivista. Basta considerar o erro perpétuo de interpretar os valores P como "a probabilidade de a hipótese nula ser verdadeira" para ver se é assim.
David C. Norris
3

"Frequentists vs. Bayesians" do XKCD (sob CC-BY-NC 2.5 ), clique para discutir:

Detector!  O que o estatístico bayesiano diria se eu perguntasse a ele se eu sou UM DETECTOR DE NEUTRINO, NÃO UM GUARDA DE LABIRINTO.  SÉRIO, SEU CÉREBRO CAIU?  [rolo] '... sim.'

O ponto geral da filosofia frequentista ilustrada aqui é uma crença em tirar conclusões sobre a probabilidade relativa de eventos baseados apenas ("puramente") nos dados observados, sem "poluir" esse processo de estimativa com noções pré-concebidas sobre como as coisas devem ou não. não deveria ser. Ao apresentar uma estimativa de probabilidade, o frequentista não leva em consideração crenças anteriores sobre a probabilidade de um evento quando existem observações disponíveis para apoiar o cálculo de sua probabilidade empírica. O frequentista deve levar em consideração essas informações básicas ao decidir sobre o limiar para ação ou conclusão.

Como Dikran Marsupial escreveu em um comentário conciso abaixo : "O ponto valioso que o desenho animado (talvez não intencionalmente) faz é que a ciência é realmente mais complexa e não podemos simplesmente aplicar o" ritual nulo "sem pensar em conhecimento prévio".

Como outro exemplo, ao tentar determinar / declarar quais tópicos são "tendências" no Facebook, os freqüentadores provavelmente gostariam da abordagem de contagem mais puramente algorítmica que o Facebook está adotando , em vez do modelo antigo em que os funcionários selecionariam essa lista com base em próprias perspectivas de fundo sobre quais tópicos eles pensavam "deveriam" ser mais importantes.

WBT
fonte
10
-1. Eu amo o XKCD, mas sem nenhum comentário, receio que isso só seja enganoso neste tópico. E é preciso um pouco de comentários para explicar corretamente quais são os problemas pertinentes a esse quadrinho. Se você fornecer a discussão apropriada, removerei o voto negativo.
Ameba diz Reinstate Monica
4
Não é verdade que a abordagem freqüentista não possua as noções pré-concedidas, elas estão codificadas no limiar da significância estatística. ISTR, há uma boa citação de Fisher sobre isso, dependendo da natureza do experimento. Esse é inteiramente o problema dos freqüentadores do desenho animado, eles apenas não definiram um valor apropriado para , pois não levaram em conta o "conhecimento prévio" sobre o problema (que o sol se torna nova é extremamente improvável) e ajustou o teste em conformidade. Usando 95% todo o tempo faz parte do "ritual nulo" muito criticado. α
Dikran Marsupial
4
O "ritual nulo" é uma má aplicação das estatísticas freqüentistas, mas não é um problema com o frequintismo per se.
Dikran Marsupial
2
@Dikran Seus comentários parecem (incorretamente) igualar "Frequentist" a "user of NHSTs". Esse é o tipo de confusão que me preocupou.
whuber
3
@luchonacho FWIW, há uma discussão sobre o desenho animado do XKCD aqui stats.stackexchange.com/questions/43339/… O ponto valioso que o desenho animado (talvez sem querer) faz é que a ciência é realmente mais complexa e não podemos simplesmente aplicar o "nulo ritual "sem pensar em conhecimento prévio.
Dikran Marsupial
3

(Uma observação, apenas relevante tangencialmente para a pergunta e o site.)

A probabilidade é sobre o status objetivo de coisas individuais . As coisas não podem ter intenção e recebem seus status do universo. Com uma coisa, um evento (dando a ela seu status) sempre deve ter acontecido: o evento já está lá realizado, mesmo que ainda não tenha acontecido - o futuro passado de uma coisa, também chamado de "destino" ou contingência.

Mais uma vez, com probabilidade, o fato de evento - tendo ainda ocorrido ou não, não importa - é já lá [em oposição ao significado que jamais é lá]; e, como tal, já se tornou desnecessário e supérfluo. O fato deve ser descartado e essa invalidação é o que chamamos de "o evento é provável". Qualquer fato sobre uma coisa tem em si o seu lado primordial e pouco convincente, ou a probabilidade do fato (mesmo o fato realmente ocorrido - nós o reconhecemos com uma pitada de descrença). Estamos inevitavelmente "cansados ​​das coisas" pré-psiquicamente até certo ponto. Resta, portanto, apenas quantificar essa negação parcial da facticidade, se necessário, um número. Uma maneira de quantificar é contar. Outra é pesar . Um frequentista realiza ou imagina uma série de tentativas diante dele, que se vira para ver se o evento realmente acontece; ele conta. Um bayesiano considera uma série de motivos psicológicos se arrastando atrás dele, que ele exibe; ele os pesa como coisas. Ambos os homens estão ocupados com o jogo de carga / desculpa da mente. Fundamentalmente, não há muita diferença entre eles.

Possibilidade é sobre potencialidades minhas no mundo. A possibilidade é sempre minha (a chance de uma chuva é o meu problema de optar por pegar um guarda-chuva ou se molhar) e não diz respeito a um objeto (o que eu considero ser possível ou ter a possibilidade), mas ao mundo inteiro para mim. A possibilidade é sempre 50/50 e é sempre convincente, porque implica - exige antes ou implica depois - minha decisão de como se comportar. As próprias coisas não têm intenções e, portanto, possibilidades. Não devemos confundir nossas possibilidades dessas coisas para nós com suas próprias probabilidades de "determinismo estocástico". A probabilidade nunca pode ser "subjetiva" no sentido humano.


Um leitor atento pode sentir na resposta uma escavação mascarada com a resposta brilhante neste tópico, onde @amoeba diz que pensa "there are almost no frequentists of the [probability definition] kind (P-frequentists)". Poderia ser contrário: os definidores de probabilidade bayesiana não existem como classe diferente. Porque, como eu admiti, os bayesianos consideram as mudanças da realidade da mesma maneira que os freqüentadores - como uma série de fatos; apenas esses fatos não são experimentos, mais cedo lembranças de "verdades" e "argumentos". Mas essas formas de conhecimento são factuais e só podem ser contadas ou pesadas. A probabilidade que ela cria não é sintetizada como subjetiva, ou seja , antecipatória ("bayesiana"), a menos que a expectativa humana(possibilidade) entra em cena para se intrometer. E @amoeba o deixa ansiosamente quando imagina como "a moeda se desgastará e o Sol se tornará uma supernova".

ttnphns
fonte
0

Ah, eu sou freqüentador por muitos anos
e gastei todo o meu tempo reproduzindo os dados de ouvido,
mas agora estou voltando com Bayes em ótimas lojas,
e nunca mais vou tocar com freqüentador.

Pois não é nunca, não, nunca, nunca, não, mais
Jogarei o freqüentador, não, nunca, não mais!

Entrei em um laboratório onde costumava consultar.
Eles me deram alguns dados, disseram 'p para nós',
eu disse 'De jeito nenhum, José' com um sorriso,
valores de P e evidentes simplesmente não se reconciliam!

Refrão

Eu disse que é sua prévia que precisamos esclarecer.
E os olhos do pesquisador se arregalaram de alegria.
Ele disse: 'Minhas opiniões anteriores são tão boas quanto as demais,
e com certeza o fator Bayes é o que funcionará melhor!'

Refrão

Voltarei aos meus professores, confessarei o que fiz
e pedirei que perdoem o filho pródigo.
Mas , quando me perdoam , como sempre,
nunca mais interpreto o freqüentador!

Refrão

E não, não, nunca, não, nunca, nunca mais,
Eu irei bancar o freqüentador, não, nunca, não mais!

Fonte: AE Raftery, no The Bayesian Songbook, editado por BP Carlin, em http://www.biostat.umn.edu/ . Cantada com a música folclórica tradicional de 'The Wild Rover'. Citado em Estatística Matemática da Universidade Aberta M347, Unidade 9.

sopa de dragão
fonte
2
Isso deve ser publicado aqui: stats.stackexchange.com/questions/1337/statistics-jokes
Tim
Concordo com @Tim e -1 porque não vejo como isso contribui para a discussão atual.
ameba diz Restabelecer Monica