Por que precisamos de álgebras sigma para definir espaços de probabilidade?

122

Temos um experimento aleatório com diferentes resultados formando o espaço amostral Ω, em que olhamos com interesse em determinados padrões, chamados eventos As álgebras sigma (ou campos sigma) são compostas de eventos aos quais uma medida de probabilidade pode ser atribuída. Certas propriedades são cumpridas, incluindo a inclusão do conjunto nulo e todo o espaço de amostra e uma álgebra que descreve uniões e interseções com diagramas de Venn.F. PP

Probabilidade é definida como uma função entre a álgebra e o intervalo . Ao todo, o triplo forma um espaço de probabilidade .σ[0,1](Ω,F,P)

Alguém poderia explicar em inglês simples por que o edifício de probabilidade entraria em colapso se não tivéssemos uma álgebra? Eles estão apenas no meio com aquele "F" impossivelmente caligráfico. Eu acredito que eles são necessários; Vejo que um evento é diferente de um resultado, mas o que daria errado sem a -algebras?σσ

A pergunta é: em que tipo de problemas de probabilidade, a definição de um espaço de probabilidade incluindo a álgebra se torna uma necessidade?σ


Este documento on-line no site da Universidade de Dartmouth fornece uma explicação acessível em inglês. A idéia é um ponteiro giratório girando no sentido anti-horário em um círculo de perímetro unitário :

insira a descrição da imagem aqui

Começamos construindo um botão giratório, que consiste em um círculo de circunferência da unidade e um ponteiro, como mostrado na Figura. Escolhemos um ponto no círculo e o rotulamos como 0 e depois rotulamos todos os outros pontos do círculo com a distância, digamos x , de 0 a esse ponto, medido no sentido anti-horário. O experimento consiste em girar o ponteiro e gravar o rótulo do ponto na ponta do ponteiro. Deixamos que a variável aleatória X denote o valor desse resultado. O espaço da amostra é claramente o intervalo [0,1). Gostaríamos de construir um modelo de probabilidade no qual cada resultado tenha a mesma probabilidade de ocorrer. Se prosseguirmos como fizemos [...] em experimentos com um número finito de resultados possíveis, devemos atribuir a probabilidade 0 a cada resultado, pois, caso contrário, a soma das probabilidades, sobre todos os resultados possíveis, não igual a 1. (De fato, somar um número incontável de números reais é um negócio complicado; em particular, para que essa soma tenha algum significado, no máximo, muitas das somas podem ser diferentes de 0 ). No entanto, se todas as probabilidades atribuídas são 0 , então a soma é 0 , não 1 , como deveria ser.

Portanto, se atribuíssemos a cada ponto qualquer probabilidade e, considerando que há um número infinito de pontos (incontável), sua soma somaria >1 .

Antoni Parellada
fonte
9
Parece autodestrutivo pedir respostas sobre os campos que não mencionam a teoria da medida! σ
Xi'an
5
Mas sim ... não sei se entendi o seu comentário.
Antoni Parellada
8
Certamente a necessidade de campos sigma não é apenas uma questão de opinião ... Acho que isso pode ser considerado no tópico aqui (na minha opinião).
Gung
8
Se a sua necessidade de teoria das probabilidades é limitada a "cara" e "coroa", então claramente não há necessidade de campos ! σ
Xi'an
26
Eu acho que essa é uma boa pergunta. Com frequência, você vê nos livros didáticos referências completamente supérfluas às probabilidades triplas que o autor passa a ignorar completamente a partir de então. (Ω,F,P)
dsaxton

Respostas:

124

Para o primeiro ponto de Xi'an: quando você está falando sobre álgebras , está perguntando sobre conjuntos mensuráveis, então, infelizmente, qualquer resposta deve se concentrar na teoria das medidas. Vou tentar fazer isso com cuidado, no entanto.σ

Uma teoria da probabilidade admitindo todos os subconjuntos de conjuntos incontáveis ​​quebrará a matemática

Considere este exemplo. Suponha que você tem um quadrado unitário em , e você estiver interessado na probabilidade de selecionar aleatoriamente um ponto que é membro de um conjunto específico na unidade quadrado. Em muitas circunstâncias, isso pode ser prontamente respondido com base em uma comparação de áreas dos diferentes conjuntos. Por exemplo, podemos desenhar alguns círculos, medir suas áreas e, em seguida, calcular a probabilidade como a fração do quadrado que cai no círculo. Muito simples.R2

Mas e se a área do conjunto de interesses não estiver bem definida?

Se a área não estiver bem definida, podemos raciocinar com duas conclusões diferentes, mas completamente válidas (em certo sentido) sobre o que é a área. Então, podemos ter por um lado, e P ( A ) = 0, por outro lado, o que implica 0 = 1 . Isso quebra toda a matemática além do reparo. Agora você pode provar 5 < 0 e várias outras coisas absurdas. Claramente, isso não é muito útil.P(A)=1P(A)=00=15<0

-algebras são o patch que corrige a matemáticaσ

O que é uma álgebra, precisamente? Na verdade, não é tão assustador. É apenas uma definição de quais conjuntos podem ser considerados eventos. Elementos que não estão em F simplesmente não têm uma medida de probabilidade definida. Basicamente, as σ- álgebras são o "patch" que nos permite evitar alguns comportamentos patológicos da matemática, nomeadamente conjuntos não mensuráveis.σFσ

Os três requisitos de um campo podem ser considerados consequências do que gostaríamos de fazer com probabilidade: Um campo σ é um conjunto que possui três propriedades:σσ

  1. Encerramento sob sindicatos contáveis.
  2. Fechamento sob cruzamentos contáveis.
  3. Fechamento sob complementos.

As uniões contáveis ​​e os componentes de interseções contáveis ​​são conseqüências diretas do problema do conjunto não mensurável. Encerramento sob complementos é uma consequência dos axiomas Kolmogorov: se , P ( A c ) deveria ser 1 / 3 . Mas sem (3), pode acontecer que P ( A c ) seja indefinido. Isso seria estranho. O fechamento sob complementos e os axiomas de Kolmogorov permitem dizer coisas como P ( A A c ) = P (P(A)=2/3P(Ac)1/3P(Ac) .P(AAc)=P(A)+1P(A)=1

Finalmente, estamos considerando eventos em relação a , por isso exigimos ainda que Ω FΩΩF

Boas notícias: álgebras são estritamente necessárias para conjuntos incontáveisσ

Mas! Há boas notícias aqui também. Ou, pelo menos, uma maneira de contornar o problema. Só precisamos de álgebras se estivermos trabalhando em um conjunto com cardinalidade incontável. Se nos restringirmos a conjuntos contáveis, então podemos tomar F = 2 Ω o conjunto de potências de Ω e não teremos nenhum desses problemas porque, para os contáveis Ω , 2 Ω consiste apenas em conjuntos mensuráveis. (Isso é mencionado no segundo comentário de Xi'an.) Você notará que alguns livros didáticos realmente cometerão um truque sutil aqui, e só considerarão conjuntos contáveis ​​ao discutir espaços de probabilidade.σF=2ΩΩΩ2Ω

Além disso, em problemas geométricos em , é perfeitamente suficiente considerar apenas as σ- álgebras compostas de conjuntos para os quais a medida L n é definida. Para fundamentar isso de maneira um pouco mais firme, L n para n = 1 , 2 , 3 corresponde às noções usuais de comprimento, área e volume. Então, o que estou dizendo no exemplo anterior é que o conjunto precisa ter uma área bem definida para ter uma probabilidade geométrica atribuída a ele. E a razão é a seguinte: se admitirmos conjuntos não mensuráveis, podemos terminar em situações nas quais podemos atribuir a probabilidade 1 a algum evento com base em alguma prova e a probabilidade 0 aRnσLnLnn=1,2,3o mesmo evento de evento com base em alguma outra prova.

Mas não deixe que a conexão com conjuntos incontáveis ​​o confunda! Um equívoco comum de que álgebras são conjuntos contáveis. De fato, eles podem ser contáveis ​​ou incontáveis. Considere esta ilustração: como antes, temos um quadrado unitário. Defina F = Todos os subconjuntos do quadrado da unidade com  medida L 2 definida  . Você pode desenhar um quadrado B com comprimento lateral s para todos os s ( 0 , 1 ) e com um canto em ( 0 , 0 )σ

F=All subsets of the unit square with defined L2 measure.
Bss(0,1)(0,0). Deve ficar claro que esse quadrado é um subconjunto do quadrado da unidade. Além disso, todos estes quadrados definiram área, de modo que estes quadrados são elementos de . Mas também deve ficar claro que existem incontáveis ​​muitos quadrados B : o número desses quadrados é incontável, e cada quadrado definiu a medida de Lebesgue.FB

Então, como uma questão prática, basta fazer essa observação com frequência suficiente para fazer a observação de que você considera apenas conjuntos mensuráveis ​​de Lebesgue para avançar no problema de interesse.

Mas espere, o que é um conjunto não mensurável?

Receio que só posso lançar um pouco de luz sobre isso. Mas o paradoxo de Banach-Tarski (às vezes o paradoxo "sol e ervilha") pode nos ajudar um pouco:

Dada uma bola sólida no espaço tridimensional, existe uma decomposição da bola em um número finito de subconjuntos disjuntos, que podem ser reunidos de uma maneira diferente para produzir duas cópias idênticas da bola original. De fato, o processo de remontagem envolve apenas mover as peças e girá-las, sem alterar sua forma. No entanto, as peças em si não são "sólidas" no sentido usual, mas dispersas infinitas de pontos. A reconstrução pode trabalhar com apenas cinco peças.

Uma forma mais forte do teorema implica que, dados dois objetos sólidos "razoáveis" (como uma bola pequena e uma bola enorme), qualquer um pode ser remontado no outro. Isso geralmente é declarado informalmente como "uma ervilha pode ser cortada e remontada ao sol" e chamada de "paradoxo da ervilha e do sol". 1 1

Portanto, se você estiver trabalhando com probabilidades em e usando a medida de probabilidade geométrica (a razão de volumes), deseja calcular a probabilidade de algum evento. Mas você se esforçará para definir essa probabilidade com precisão, porque pode reorganizar os conjuntos de seu espaço para alterar os volumes! Se a probabilidade depender do volume e você puder alterar o volume do aparelho para o tamanho do sol ou o tamanho de uma ervilha, a probabilidade também mudará. Portanto, nenhum evento terá uma única probabilidade atribuída a ele. Pior ainda, você pode reorganizar S Ω tal que o volume de S tem V ( S ) > V ( Ω )R3SΩSV(S)>V(Ω), o que implica que a medida de probabilidade geométrica reporta uma probabilidade , em flagrante violação dos axiomas de Kolmogorov, que exigem que a probabilidade tenha a medida 1.P(S)>1

Para resolver esse paradoxo, pode-se fazer uma das quatro concessões:

  1. O volume de um conjunto pode mudar quando é girado.
  2. O volume da união de dois conjuntos separados pode ser diferente da soma de seus volumes.
  3. Os axiomas da teoria dos conjuntos de Zermelo-Fraenkel com o axioma da escolha (ZFC) podem ter que ser alterados.
  4. Alguns conjuntos podem ser marcados como "não mensuráveis" e é necessário verificar se um conjunto é "mensurável" antes de falar sobre seu volume.

A opção (1) não ajuda a definir probabilidades de definição, então está desativada. A opção (2) viola o segundo axioma de Kolmogorov, então está desativado. A opção (3) parece uma péssima idéia porque o ZFC corrige muito mais problemas do que cria. Mas a opção (4) parece atraente: se desenvolvermos uma teoria sobre o que é e o que não é mensurável, teremos probabilidades bem definidas nesse problema! Isso nos leva de volta à teoria da medida, e nosso amigo, a álgebra.σ

Sycorax
fonte
5
Obrigado pela sua resposta. significa Lebesque mensurável? Vou +1 sua resposta na fé, mas eu realmente aprecio isso se você poderia trazer para baixo o nível de matemática vários entalhes ... :-)L
Antoni Parellada
7
(+1) Bons pontos! Eu também acrescentaria que, sem medida e álgebras, o condicionamento e a distribuição condicional derivada em espaços incontáveis ​​ficam bastante peludos, como mostra o paradoxo de Borel-Kolmogorov . σ
Xi'an
2
@ Xi'an Obrigado por palavras amáveis! Realmente significa muito, vindo de você. Eu não estava familiarizado com o paradoxo de Borel-Kolmogorov até o momento em que escrevi, mas vou fazer algumas leituras e ver se consigo fazer uma adição útil às minhas descobertas.
Sycorax 01/03
3
@ Student001: Acho que estamos dividindo cabelos aqui. Você está certo de que a definição geral de "medida" (qualquer medida) é dada usando o conceito de álgebras sigma. Meu argumento, no entanto, é que não há palavra ou conceito de "sigma-álgebra" na definição da medida de Lebesgue fornecida no meu primeiro link. Em outras palavras, é possível definir a medida de Lebesgue conforme meu primeiro link, mas é preciso mostrar que é uma medida e essa é a parte mais difícil. Concordo que deveríamos interromper essa discussão.
Ameba
3
Gostei muito de ler sua resposta. Não sei como agradecer, mas você esclareceu bastante as coisas! Eu nunca estudei análise real nem tive uma introdução adequada à matemática. Veio de um background em Engenharia Elétrica que se concentrou muito na implementação prática. Você escreveu isso em termos tão simples que um sujeito como eu poderia entender. Eu realmente aprecio sua resposta e a simplicidade que você forneceu. Também obrigado a @ Xi'an por seus comentários empacotados!
Zushauque 29/09
19

[0,18),[18,25),[25,34),(Ω,F)F[18,25)[20,30)[20,30)F

(Ω,F)f:f1(1)Ff

FFABABAB. Agora, exigir fechamento para interseções e uniões contáveis ​​nos permite perguntar conjunções ou disjunções contáveis. E negar uma pergunta é representado pelo conjunto complementar. Isso nos dá uma álgebra sigma.

Eu vi esse tipo de introdução primeiro no muito bom livro de Peter Whittle, "Probabilidade via expectativa" (Springer).

EDITAR

iiσσnσnσ

Mas será que realmente precisamos da lei forte de grandes números? De acordo com uma resposta aqui , talvez não.

nn

σ

kjetil b halvorsen
fonte
4
σP(A)[20,30)P(A)[20,30)P(A)[18,34)bem definido, não fica claro que este exemplo ilustra o que você deseja.
Sycorax
5
σσ
2
σ
3
Eu acho que seu argumento é sólido. Fiquei um pouco surpreso no final, no entanto, quando encontrei esta afirmação: "exigir fechamento para cruzamentos e uniões contáveis ​​nos permite pedir conjunções ou disjunções contáveis". Isso parece estar no cerne da questão: por que alguém iria querer construir um evento tão infinitamente complicado? Uma boa resposta para isso tornaria o resto da sua postagem mais persuasiva.
whuber
2
Re usos práticos: a teoria da probabilidade e da medida usada na matemática das finanças (incluindo equações diferenciais estocásticas, integrais Ito, filtrações de álgebras etc.) parece que seria impossível sem álgebras sigma. (Eu não posso votar
novamente
2

σ

σAB(AB)C

O primeiro axioma é esse ∅, 𝑋∈𝜎. Bem, você SEMPRE sabe a probabilidade de nada acontecer (0) ou algo acontecer (1).

O segundo axioma é fechado sob complementos. Deixe-me dar um exemplo estúpido. Mais uma vez, considere um lançamento de moeda, com 𝑋 = {𝐻, 𝑇}. Finja que eu lhe digo que a ebra álgebra para esse flip é {∅, 𝑋, {𝐻}}. Ou seja, eu sei a probabilidade de NADA acontecer, de ALGO acontecer e de uma cabeça, mas NÃO conheço a probabilidade de uma coroa. Você poderia me chamar de idiota. Porque se você conhece a probabilidade de uma cara, você automaticamente conhece a probabilidade de uma coroa! Se você conhece a probabilidade de algo acontecer, sabe a probabilidade de NÃO acontecer (o complemento)!

O último axioma é fechado sob uniões contáveis. Deixe-me dar outro exemplo estúpido. Considere o lançamento de um dado, ou 𝑋 = {1,2,3,4,5,6}. E se eu dissesse a 𝜎 álgebra para isso é {∅, 𝑋, {1}, {2}}. Ou seja, eu sei a probabilidade de rolar um 1 ou rolar um 2, mas não sei a probabilidade de rolar um 1 ou um 2. Novamente, você poderia me chamar de idiota (espero que o motivo seja claro). O que acontece quando os conjuntos não são desarticulados e o que acontece com incontáveis ​​sindicatos é um pouco mais confuso, mas espero que você possa tentar pensar em alguns exemplos.

σ

Bem, não é um caso totalmente limpo, mas existem algumas razões sólidas para isso .

Por que os probabilistas precisam de medidas?

σσP

As pessoas trazem o conjunto de Vitali e Banach-Tarski para explicar por que você precisa da teoria da medida, mas acho que isso é enganoso . O conjunto de Vitali desaparece apenas para medidas (não triviais) invariantes à tradução, que os espaços de probabilidade não exigem. E Banach-Tarski requer invariância à rotação. As pessoas de análise se preocupam com elas, mas os probabilistas realmente não .

A razão de ser da teoria da medida na teoria das probabilidades é unificar o tratamento de RVs discretos e contínuos e, além disso, permitir RVs misturados e RVs que simplesmente não são.

Yatharth Agarwal
fonte
Penso que esta resposta pode ser um ótimo complemento para esta discussão se você a refazer um pouco. Tal como está, é difícil de seguir, porque grandes partes dela dependem de links para outros tópicos de comentários. Eu acho que se você a apresentasse como uma explicação de baixo para cima de como as medidas, finitasσσ