Sou estudante de estatística. Estou tentando entender as definições clássicas e objetivas de probabilidade e como elas estão relacionadas à inferência freqüentista e bayesiana. Não é óbvio para mim por que a probabilidade clássica é combinada com a inferência freqüentista e por que a inferência bayesiana é combinada com a probabilidade subjetiva. Em algumas fontes, li declarações como as seguintes deste artigo de Wellek (desculpe, não encontrei uma versão que não estivesse atrás de um muro de pagamento):
Do ponto de vista freqüentista, os parâmetros populacionais são constantes não observáveis sobre as quais nenhuma declaração de probabilidade significativa pode ser feita.
Estou tentando entender se isso se deve à definição clássica de probabilidade como ensaios repetidos ou se se deve às restrições da inferência freqüentista.
Minhas perguntas específicas estão no final, se os leitores preferem pular adiante, mas eu queria compartilhar meus pensamentos, caso isso ajude.
Considere a variável aleatória . Sob a definição clássica de probabilidade, se eu quisesse medir cientificamente empiricamente a probabilidade de que , acho que só preciso repetir o experimento várias vezes e fazer uma contagem. Pela definição subjetiva, acho que devo consultar inicialmente minhas próprias crenças ou as crenças de um agente racional. À medida que coleto mais dados, essas crenças são modificadas racionalmente.
Agora parece-me que não pode ser observado; portanto, não há como calcular o valor de pelo meu procedimento empírico clássico. Por outro lado, sempre posso acreditar em coisas que não consigo observar diretamente como e, portanto, assumindo que conheço alguma relação entre coisas que posso observar como e coisas que não consigo observar como , isso me permite ter crenças sobre que eu posso modificar racionalmente ao longo do tempo.
Ocorre-me que também posso argumentar que, para o frequentista, é uma propriedade fixa do universo, de qualquer maneira, talvez eu esteja preso à noção de que é fixo, mesmo que eu pudesse observá-lo. Mas e se pensarmos no experimento típico de jogar uma moeda e modificá-la para dizer que tenho uma grande quantidade de moedas e sempre uso uma nova sempre que gravo um flip? Portanto, nesse caso, suspeito que exista um parâmetro subjacente que seja específico da moeda, mas nunca posso observá-lo diretamente. Portanto, é significativo, mas não posso computá-lo via observação direta de .
Então, apenas para retornar às minhas perguntas de alto nível.
Existe alguma maneira significativa de interpretar um procedimento de inferência bayesiana como um freqüentista?
Existe alguma maneira significativa de fazer inferência bayesiana onde as probabilidades são definidas de acordo com a definição clássica de probabilidade?
fonte
Respostas:
Há uma pergunta muito semelhante anterior em: A probabilidade é fundamentalmente sobre classes de referência (reais ou imaginárias)? e eu realmente estou tentando aqui responder a ambos. Devemos começar com o que é probabilidade?
A resposta matemática é que o que preenche os axiomas de probabilidade usuais é uma probabilidade. Mas isso realmente não responde à nossa pergunta! porque estamos em como podemos usar a probabilidade , como podemos interpretar a probabilidade . No meu pensamento (hoje, 7 de março de 2018, amanhã ...), todas as concepções de probabilidade (freqüentista, subjetiva, pessoal, ...) têm uma coisa importante em comum, que lhes dá um significado comum. Esse é o conceito de calibração ou classes de referência . Para calibração, consulte, por exemplo, Visualização da calibração da probabilidade prevista de um modelo ou pesquise neste site por "calibração". Para classes de referência, a primeira postagem vinculada.
A calibração difere em que tipo de classes de referência você está calibrando:
Poderíamos dizer que a probabilidade tem uma face de Janus:
(ou talvez seja melhor dizer que a probabilidade é um troll de muitas cabeças!)
Com esse ponto de vista, parece que há um continuum de interpretações, de muito objetivo a muito subjetivo! mais do que discretas interpretações diferentes. Muitas discussões práticas sobre probabilidade podem ser enquadradas dentro desses conceitos, um exemplo: qual é a probabilidade de uma explosão no Mar do Norte? Pouco antes da explosão do Bravo no campo Ekofisk https://en.wikipedia.org/wiki/Ekofisk_oil_fieldIsso foi discutido no Storting, um membro perguntou o que havia sido feito sobre o risco de explosão e mencionou probabilidades retiradas da experiência histórica do golfo do México. O ministro do petróleo Bjartmar Gjerde respondeu que isso o lembrava a mulher que tinha três filhos e não queria mais, porque ouvira dizer que cada quarto filho nascido era chinês ... No dia seguinte à explosão, o jornal dagbladet tinha o seguinte título: "Um chinês nasce no mar do Norte". Portanto, a experiência do Golfo do México deve ser usada na formação de classes de referência para o Mar do Norte, ou formuladas de outra forma, as explosões no Golfo do México e no Mar do Norte devem ser calibradas juntas ou separadamente? Não há uma resposta completamente objetiva a essas perguntas, tornando essas avaliações parcialmente subjetivas, mesmo que visemos interpretações de frequência.
Portanto, "subjetividade" em "probabilidade subjetiva" significa que pessoas razoáveis diferentes podem chegar a diferentes avaliações, definir classes de referência de maneiras diferentes, não que "tudo corra". Para que a probabilidade subjetiva seja significativa, espera-se que as classes de referência (ou procedimento de calibração) sejam feitas o mais explícitas possível, para que a discussão e a crítica sejam possíveis. Caso contrário, ele apenas degenerará em um jogo de adivinhação de números.
Portanto, nesse sentido, a probabilidade (subjetiva) é significativa apenas para eventos cuja probabilidade pode ser calibrada. Um exemplo em que isso não é possível (acredito) éP( Deus existe ) . A calibração é impossível, portanto, essa probabilidade não pode ser significativa. Nesse sentido, podemos falar sobre probabilidade (subjetiva) de eventoE somente se a ocorrência ou não de E acabará por ser conhecido, ou pelo menos o que é possível, pelo menos em princípio.
Então, para sua primeira pergunta:
Bem, o frequentista escolhe não fazer nenhuma declaração de probabilidade sobre o valor do parâmetro desconhecido (mas fixo), mas ele é forçado a fazer essa escolha? Agora ele não é. Como exemplo, deixe o parâmetroμ representam a altura média de homens noruegueses de 20 anos. Como não sabemos o valor exato, faz sentido fazer apostas em eventos (proposições) envolvendom u digamos E= { μ < = 1,73 m } . Mas acima dissemos que "... podemos falar sobre probabilidade (subjetiva) de eventoE somente se a ocorrência ou não de E acabará por ser conhecido, ... ". É esse o caso de E ? Não como formulado, mas bayesianos como DeFinetti refletiram profundamente sobre esse problema e apresentaram a seguinte resolução. DeixeiX= (X1 1,X2, ... ,Xn, ... ) observação da altura em uma amostra aleatória de 20 anos de machos noruegueses. Antes de coletar a amostra, teremos algumas expectativas sobre os possíveis valores. Sendo uma amostra aleatória, a distribuição deX será intercambiável . deFinetti provou seu teorema da representação, um (infinitamente) trocávelX pode ser representado como condicionalmente independente, dada uma variável latente subjacente, no exemplo μ (e talvez alguns outros parâmetros como σ ) e com uma distribuição prévia dessas variáveis / parâmetros latentes. Dessa maneira, podemos construir uma distribuição de probabilidade (anterior) emμ , e ainda pense nisso como uma constante desconhecida! Isso pode parecer estranho, mas pode ser resolvido pensando nessa distribuição como epistêmica , não aleatória . Desta forma, a aposta emμ pode ser traduzido para uma aposta em X , que podemos resolver.
(ainda não terminou, mas já é tarde da noite ...) Espero que ajude, estou realmente escrevendo isso para esclarecer minhas idéias para mim ... Há muito trabalho a fazer para tornar essa configuração matematicamente rigorosa, embora eu espero que isso possa ser feito. Se alguém tiver algumas referências relevantes interessantes, por favor, ...
fonte