Por que variáveis ​​aleatórias são definidas como funções?

21

Estou tendo problemas para entender o conceito de uma variável aleatória como uma função. Eu entendo a mecânica (acho) mas não entendo a motivação ...

Dizer é uma probabilidade tripla, onde , é a álgebra de Borel- nesse intervalo e é a medida regular de Lebesgue. Seja uma variável aleatória de a tal que , , ..., , então tem uma distribuição uniforme discreta nos valores de 1 a 6. Ω = [ 0 , 1 ] B σ P X B { 1 , 2 , 3 , 4 , 5 , 6 } X ( [ 0 , 1 / 6 ) ) = 1 X ( [ 1 / 6 , 2 / 6 ) ) = 2 X ( [(Ω,B,P)Ω=[0 0,1]BσPXB{1,2,3,4,5,6}X([0,1/6))=1X([1/6,2/6))=2X([5/6,1])=6X

Tudo bem, mas eu não entendo a necessidade da probabilidade original tripla ... poderíamos ter construído diretamente algo equivalente como onde é toda a apropriada do espaço e é uma medida que atribui a cada subconjunto a medida (número de elementos) / 6. Além disso, a escolha de foi arbitrária - poderia ter sido ou qualquer outro conjunto.({1,2,3,4,5,6},S,Px)SσPxΩ=[0,1][0,2]

Então, minha pergunta é: por que se preocupar em construir um arbitrário com uma álgebra e uma medida e definir uma variável aleatória como um mapa da álgebra para a linha real? Ωσσ

Leo Vasquez
fonte
5
Note-se que a variável aleatória é a função de de , não de para . O requisito é que a variável aleatória seja mensurável em relação a . R B R BΩRBRB
mpiktas 14/05

Respostas:

21

Se você está se perguntando por que todo esse maquinário é usado quando algo muito mais simples pode ser suficiente - você está certo, nas situações mais comuns. Entretanto, a versão teórica da probabilidade da medida foi desenvolvida por Kolmogorov com o objetivo de estabelecer uma teoria de tal generalidade que pudesse lidar com, em alguns casos, espaços de probabilidade muito abstratos e complicados. De fato, os fundamentos teóricos da medida de Kolmogorov para a probabilidade finalmente permitiram que as ferramentas probabilísticas fossem aplicadas muito além do domínio de aplicação pretendido original em áreas como a análise harmônica.

A princípio, parece mais simples pular qualquer -algebra "subjacente" e simplesmente atribuir massas de probabilidade aos eventos que compõem o espaço da amostra diretamente, como você propôs. De fato, os probabilistas efetivamente fazem a mesma coisa sempre que escolhem trabalhar com a "medida induzida" no espaço amostral definido por . No entanto, as coisas começam a ficar complicadas quando você começa a entrar em espaços dimensionais infinitos. Suponha que você queira provar a Lei Forte dos Grandes Números para o caso específico de lançar moedas justas (ou seja, que a proporção de cabeças tende arbitrariamente perto de 1/2, à medida que o número de moedas vira para o infinito). Você pode tentar construir umΩ P X - um σ ( H , T , H , . . . ) Ω = [ 0 , 1 ) 0,10100 ...σΩPX1σ-algebra no conjunto de sequências infinitas da forma . Mas aqui podemos descobrir que é muito mais conveniente usar o espaço subjacente como ; e, em seguida, use as representações binárias de números reais (por exemplo, ) para representar seqüências de lançamentos de moedas (1 sendo , 0 sendo coroa). Uma ilustração desse mesmo exemplo pode ser encontrada nos primeiros capítulos de Probabilidade e Billingsley. Medida .(H,T,H,...)Ω=[0,1)0.10100...

charles.y.zheng
fonte
Obrigado! Vou verificar esse livro. No entanto, desde o ainda é arbitrária (que poderia muito bem sido [ 0 , 2 ) no seu exemplo, é o intervalo unitário [ 0 , 1 ] ou [ 0 , 1 ) o espaço 'preferido', que irá trabalhar em todas as circunstâncias ? Ou existem situações em que um mais complicado Ω , como R 2 seria benéfico? Ω[0,2)[0,1][0,1)ΩR2
Leo Vasquez
2
@ Leo: Sim. Os processos estocásticos em tempo contínuo fornecem um exemplo. O exemplo canônico é o movimento browniano, onde o espaço de amostra é considerado C , o espaço de todas as funções contínuas de valor real. ΩC
cardeal
1
@ NRH, Sim, eu deveria ter dito que pode ser tomada em vez de ser tomada . Eu estava (um tanto propositalmente) tentando escová-lo debaixo do tapete.
cardeal
1
@ cardinal, no comentário de @ Leo foi perguntado se é 'preferido' em todas as circunstâncias. Estou apenas dizendo que IMO não existe tal Ω e que é benéfico não exigir nada sobre Ω em geral. Quando você quiser trabalhar com um exemplo específico, pode haver razões para escolher um específico Ω . Note, no entanto, que a 'tautologia' está varrendo para debaixo do tapete que a existência do movimento browniano como uma medida de probabilidade em C precisa ser estabelecida. [0,1]ΩΩΩC
NRH 14/05
2
@ NRH, desculpe pela minha lentidão hoje. Não consegui conectar a referência preferida ao comentário anterior de @ Leo. Obrigado. Em relação à observação da "tautologia", meu argumento foi que, em outras construções, a continuidade dos caminhos das amostras é um teorema , enquanto que, na construção baseada em com mapa de identidade, é tautológica. Obviamente, o fato de o BM poder ser construído dessa maneira deve primeiro ser mostrado. Mas, isso é um pouco irrelevante. C
cardeal
10

As questões relativas às álgebras são sutilezas matemáticas, que não explicam realmente por que ou se precisamos de um espaço em segundo plano . Na verdade, eu diria que não há evidências convincentes de que o espaço de fundo seja uma necessidade. Para qualquer configuração probabilística ( E , E , μ ) em que E é o espaço da amostra, E a σ- álgebra e μ uma medida de probabilidade, o interesse é em μ e não há razão abstrata para que μ seja a medida da imagem de um mapa mensurável X : ( Ω , Bσ(E,E,μ)EEσμμμ .X:(Ω,B)(E,E)

No entanto, o uso de um espaço de fundo abstrato fornece conveniência matemática que faz com que muitos resultados pareçam mais naturais e intuitivos. O objetivo é sempre a dizer algo sobre , a distribuição de X , mas pode ser mais fácil e mais claramente expressa em termos de X .μXX

Um exemplo é dado pelo teorema do limite central. Se é seu valor real com média μ e variância σ 2, o CLT diz que P ( X1,,Xnμσ2 ondeΦé a função de distribuição para a distribuição normal padrão. Se a distribuição deXiéμ,o resultado correspondente em termos da medida indica ρ

P(nσ(1ni=1nXiξ)x)Φ(x)
ΦXiμ é necessária alguma explicação sobre a terminologia por.μ*nqueremos dizer an-times convolução deμ(a distribuição da soma).Asfunçõesρcsão as funções linearesρc(x)=cxe
ρn/στξρ1/n(μn)((,x])Φ(x)
μnnμρcρc(x)=cx é a tradução τ ξ ( x ) = x - ξ . Provavelmente, alguém poderia se acostumar com a segunda formulação, mas faz um bom trabalho para esconder o que se trata.τξτξ(x)=xξ

O que parece ser o problema é que as transformações aritméticas envolvidas no CLT são claramente expressas em termos de variáveis ​​aleatórias, mas não se traduzem tão bem em termos de medidas.

NRH
fonte
(+1) Boa descrição. Eu acho que a outra razão pela qual a notação anterior é tão popular é que ela se traduz mais naturalmente em noções intuitivas nos aplicativos. (Votado há várias horas.)
cardeal
@ cardinal, obrigado por deixar esse ponto mais claro. Parece mais natural pensar e argumentar em termos de uma soma de variáveis, não de uma convolução de medidas de probabilidade, e gostaríamos que a matemática refletisse isso.
NRH 15/05
0

Recentemente, eu me deparei com essa nova maneira de pensar na Variável Aleatória e no espaço de fundo Ω . Não tenho certeza se essa é a pergunta que você estava procurando, pois não é uma razão matemática, mas acho que fornece uma maneira muito clara de pensar em RVs.XΩ

Imagine uma situação em que jogamos uma moeda. Essa configuração experimental consiste em um conjunto de possíveis condições iniciais que incluem a descrição física de como a moeda é lançada. O espaço de fundo consiste em todas essas condições iniciais possíveis. Por uma questão de simplicidade, podemos assumir que os lançamentos das moedas variam apenas em velocidade, e então Ω=[0,vmax]

A variável aleatória pode então ser pensada como uma função que mapeia todos os estados iniciais ω Ω com o resultado correspondente do experimento, isto é, se é coroa ou cabeça.XωΩ

Para o RV: a medida Q corresponderia então à medida da probabilidade sobre as condições iniciais, que juntamente com a dinâmica do experimento representada por XX:([0,vmax],B[0,vmax],Q)({0,1},2{0,1})QX determina a distribuição de probabilidade sobre os resultados.

Para referência a essa idéia, você pode ver os capítulos de Tim Maudlin ou Micheal Strevens em "Probabilties in Physics" (2011)

Sebastian
fonte