Definição freqüentista de probabilidade; existe uma definição formal?

10

Existe alguma definição formal (matemática) do que os freqüentadores entendem sob "probabilidade". Eu li que é a frequência relativa de ocorrência '' a longo prazo '', mas existe alguma maneira formal de defini-la? Existem referências conhecidas nas quais posso encontrar essa definição?

EDITAR:

Com frequentista (veja o comentário de @whuber e meus comentários à resposta @ Kodiologist e @Graeme Walsh abaixo dessa resposta), quero dizer aqueles que “acreditam” que essa frequência relativa de longo prazo existe. Talvez isso (parcialmente) responda à pergunta do @Tim também


fonte
7
Por favor, explique o que você quer dizer com "Frequentista". Os usos que vi em outros tópicos indicam que muitas pessoas não têm um senso consistente ou claro do que esse termo pode significar. Uma definição ajudaria, portanto, a manter quaisquer respostas relevantes.
whuber
5
@whuber Eu acho que a definição de frequencista é "não Bayesian" e de Bayesian é "não frequencista" na maioria dos casos :)
Tim
11
Intimamente relacionados: en.wikipedia.org/wiki/Empirical_probability
Silverfish
2
Eu diria que esse stats.stackexchange.com/a/230943/113090 provavelmente seria do seu interesse, mas então percebi que você é a pessoa que postou essa resposta, então não importa. De qualquer forma, seu processo de pensamento pode interessar a outras pessoas que também têm a mesma pergunta que você (por exemplo, eu) "existe uma definição freqüente formal de probabilidade"?
Chill2Macht
6
Não tenho certeza se terei energia para escrever uma resposta, mas gostaria de deixar aqui o mesmo link para a entrada da Stanford Encyclopedia of Philosophy sobre Interpretations of Probability que publiquei sob sua resposta no tópico relacionado. A seção sobre interpretação / definição frequentista é uma boa leitura. Ele fala extensivamente sobre vários problemas conceituais com tentativas de fornecer uma definição freqüente de probabilidade.
Ameba

Respostas:

4

TL; DR Não parece possível definir uma definição freqüente de probabilidade consistente com a estrutura de Kolmogorov que não seja completamente circular (isto é, no sentido da lógica circular).

limnnAn
nA

Mas todas essas noções de convergência exigem que uma medida no espaço de probabilidade seja definida como significativa. A escolha intuitiva, é claro, seria escolher convergência quase certamente. Esse recurso possui o limite necessário para existir no sentido horário, exceto em um evento de medida zero. O que constitui um conjunto de medidas zero coincidirá para qualquer família de medidas que sejam absolutamente contínuas uma em relação à outra - isso nos permite definir uma noção de convergência quase certa, tornando o limite acima rigoroso, embora seja um pouco agnóstico sobre o que os subjacentes A medida para o espaço mensurável dos eventos é (ou seja, porque poderia ser qualquer medida absolutamente contínua em relação a alguma medida escolhida). Isso impediria a circularidade na definição que surgiria da fixação antecipada de uma determinada medida,

No entanto, se estivermos usando convergência quase certa, isso significa que estamos nos limitando à situação da lei forte de grandes números (doravante SLLN). Deixe-me declarar esse teorema (como dado na p. 133 de Chung) para fins de referência aqui:

Seja uma sequência de variáveis ​​aleatórias independentes e identicamente distribuídas. Então nós temos onde .{Xn}

E|X1|<SnnE(X1)a.s.
E|X1|=limsupn|Sn|n=+a.s.
Sn:=X1+X2++Xn

Então, digamos que temos um espaço mensurável e queremos definir a probabilidade de algum evento com relação a alguma família de medidas de probabilidade mutuamente absolutamente contínuas . Então, pelo Teorema de Extensão Kolmogorov ou pelo Teorema de Extensão Ionescu Tulcea (acho que ambos funcionam), podemos construir uma família de espaços de produtos , um para cada . (Observe que a existência de espaços infinitos de produtos, que é uma conclusão do teorema de Kolmogorov, exige que a medida de cada espaço seja ; portanto, agora estou restringindo as medidas de probabilidade, em vez de arbitrárias). Então defina(X,F)AF{μi}iI{(j=1Xj)i}iIμi11Aj é a variável aleatória do indicador, ou seja, que é igual a se ocorrer na ésima cópia e se não, em outras palavrasEntão claramente (onde denota expectativa em relação a ), portanto a lei forte de grandes números de fato aplica-se a (porque, por construção, o1Aj0

nA=1A1+1A2++1An.
0Ei1Aj1Eiμi(j=1Xj)i1Ajsão distribuídos de forma idêntica e independente - observe que ser distribuído de forma independente significa que a medida do espaço do produto é multiplicativa em relação às medidas de coordenadas), portanto obtemos que e, portanto, nossa definição para a probabilidade de com relação a deve ser naturalmente .
nAnEi1A1a.s.
AμiE11A

Acabei de perceber, no entanto, que, apesar de a sequência de variáveis ​​aleatórias convergir quase certamente em relação a se e somente se convergir quase certamente em relação a , ( onde ) que não significa necessariamente que convergirá para o mesmo valor ; de fato, o SLLN garante que não, a menos que que não é verdade genericamente.nAnμi1μi2i1,i2IEi11A=Ei21A

Se é de alguma forma "canônico o suficiente", digamos, como a distribuição uniforme de um conjunto finito, talvez isso funcione bem, mas não dê novas idéias. Em particular, para a distribuição uniforme, , ou seja, a probabilidade de é apenas a proporção de pontos ou eventos elementares em que pertencem a , que novamente me parece um pouco circular. Para uma variável aleatória contínua, não vejo como poderíamos concordar com uma escolha "canônica" de .μE1A=|A||X|AXAμ

Ou seja, parece que faz sentido definir a frequência de um evento como a probabilidade do evento, mas não parece que faz sentido definir a probabilidade do evento como a frequência (pelo menos sem ser circular). Isso é especialmente problemático, pois na vida real não sabemos qual é a probabilidade; nós temos que estimar isso.

Observe também que essa definição de frequência para um subconjunto de um espaço mensurável depende da medida escolhida ser um espaço de probabilidade; por exemplo, não há medida de produto para muitas cópias de dotadas com a medida de Lebesgue, pois . Da mesma forma, a medida de usando a medida de produto canônico é , que explode até o infinito se ou passa a zero se , isto é, os teoremas de extensão de Kolmogorov e Tulcea são resultados muito especiais, peculiares às medidas de probabilidade .Rμ(R)=j=1nX(μ(X))nμ(X)>1μ(X)<1

Chill2Macht
fonte
11
Obrigado pela resposta agradável (+1). Concordo que há "problemas" com a definição em termos de frequência relativa de longo prazo, essa foi provavelmente uma das razões pelas quais Kolmogorov desenvolveu seu Grundbegriffe. No entanto, quando falamos de frequentistas, temos que nos colocar no prazo que antecede a teoria de Kolmogorov, eu acho?
2
@fcop Acho que honestamente não faço ideia. Acho que o que estou tentando dizer é que não vejo como uma justificativa rigorosa para a compreensão freqüente da probabilidade possa levar a uma definição útil / não circular.
precisa saber é o seguinte
@fcop Eu realmente aprecio a generosa recompensa - eu estava de muito mau humor hoje antes de recebê-la. Sinceramente, fiquei um pouco chocado (no bom sentido). Mais uma vez, eu realmente aprecio isso
Chill2Macht 2/16/16
não mencione, sua resposta é muito bem desenvolvida e matematicamente correta.
6

Eu não acho que exista uma definição matemática, não. A diferença entre as várias interpretações de probabilidade não é uma diferença em como a probabilidade é matematicamente definida. A probabilidade pode ser matematicamente definida da seguinte maneira: se é um espaço de medida com , então a probabilidade de qualquer evento é apenas . Espero que você concorde que essa definição seja neutra a questões como se devemos interpretar probabilidades de maneira freqüentista ou bayesiana.(Ω,Σ,μ)μ(Ω)=1SΣμ(S)

Kodiologist
fonte
tudo bem, mas essa definição de probabilidade como que preenche os axiomas de Kolmogorov é muito abstrata, precisa ser definida em casos específicos. É o mesmo que "um círculo é o conjunto de pontos que está a uma determinada distância de um ponto fixo". Isso não significa nada, desde que você não diga em que espaço métrico você está: você deve dizer qual é a definição de '' distância ''. Penso que definir como uma frequência relacionada a longo prazo cumpre os axiomas de Kolmogorov, o que você acha? PS A definição no comentário de @Silverfish também cumpre esses axiomas. μP
(continuação) então, para resumir, eu posso definir ( definir é a palavra certa), muitos que atendem aos axiomas de Kolmogorov e todas essas são probabilidades válidas de acordo com a teoria axiomática. μ
Indiscutivelmente, o sistema de Kolmogorov fornece uma base axiomática - que não implica necessariamente uma interpretação freqüentista ou bayesiana. No espírito da visão freqüentista, a idéia básica é que, à medida que o número de tentativas aumenta para a infinidade, a frequência empírica se estabiliza em torno ou converge para algum valor; a probabilidade do evento. Embora a abordagem de frequência melhore a abordagem clássica, a falta de rigor leva ao fundamento axiomático. Isso é mais uma pergunta sobre a história da teoria das probabilidades?
limn(nA/n)=PA=P(A).
Graeme Walsh
@Graeme Walsh: você poderia colocar isso em uma resposta e completá-la com argumentos por que essa definição de está alinhada com os axiomas de Kolmogorov? (é claro que se pode questionar a existência do limite, mas, em seguida, poderíamos dizer que frequentistas são aqueles que '' acreditar '' na existência dele?)P(A)
2
@fcop Como Walsh observa, essa "definição" não é rigorosa.
Kodiologist