Intuição para Expectativa Condicional de -algebra

20

Seja um espaço de probabilidade, dada uma variável aleatória e um -algebra podemos construir uma nova variável aleatória , que é a expectativa condicional.(Ω,F,μ)ξ:ΩRσGFE[ξ|G]


Qual é exatamente a intuição para pensar em ? Entendo a intuição para o seguinte:E[ξ|G]

(i) onde é um evento (com probabilidade positiva).E[ξ|A]A

(ii) onde é uma variável aleatória discreta.E[ξ|η]η

Mas não consigo visualizar . Entendo a matemática e entendo que é definido de maneira a generalizar os casos mais simples que podemos visualizar. Mas, no entanto, não acho útil esse modo de pensar. Continua sendo um objeto misterioso para mim.E[ξ|G]


Por exemplo, seja um evento com . Formar o -álgebra , aquele gerado por . Então seria igual a se e igual a se . Em outras palavras, se e se \ omega \ em A ^ c .Aμ(A)>0σG={,A,Ac,Ω}AE[ξ|G](ω)1μ(A)AξωA1μ(Ac)AcξωAE[ξ|G](ω)=E[ξ|A]ωAE[ξ|G](ω)=E[ξ|Ac]ωAc

A parte que é confusa é essa ωΩ , então por que não escrevemos apenas E[ξ|G](ω)=E[ξ|Ω]=E[ξ] ? Por que substituímos E[ξ|G] por E[ξ|A or Ac] dependendo se ωA , mas não tem permissão para substituir E[ξ|G] por E[ξ] ?


Nota. Ao responder a essa pergunta, não explique isso usando a definição rigorosa de expectativa condicional. Eu entendi aquilo. O que eu quero entender é o que a expectativa condicional deve estar calculando e por que rejeitamos um no lugar do outro.

Nicolas Bourbaki
fonte

Respostas:

16

Uma maneira de pensar na representação condicional é como uma projeção no -algebra .GσG

insira a descrição da imagem aqui( do Wikimedia commons )

Isso é realmente rigoroso quando se fala em variáveis ​​aleatórias integráveis ​​em quadrados; neste caso, é na verdade a projeção ortogonal da variável aleatória no subespaço de consiste em variáveis ​​aleatórias mensuráveis ​​em relação a . E, de fato, isso acaba sendo verdade, em certo sentido, para variáveis ​​aleatórias via aproximação por variáveis ​​aleatórias .ξ L 2 ( Ω ) G L 1 L 2E[ξ|G]ξL2(Ω)GL1L2

(Veja os comentários para referências.)

Se considerarmos álgebras como representando quanta informação temos disponível (uma interpretação que é rigorosa na teoria dos processos estocásticos), álgebras maiores significam mais eventos possíveis e, portanto, mais informações sobre possíveis resultados, enquanto menores álgebras significam menos eventos possíveis e, portanto, menos informações sobre possíveis resultados.σ - σ -σσσ

Portanto, projetando a -mensurável variável aleatória para os menores álgebra significa tomar o nosso melhor palpite para o valor de dada a informação mais limitada disponível a partir de . ξ σ - G ξ GFξσGξG

Em outras palavras, dadas apenas as informações de , e não todas as informações de , em sentido rigoroso, nosso melhor possível suposição sobre qual é a variável aleatória .F E [ ξ | G ] ξGFE[ξ|G]ξ


Com relação ao seu exemplo, acho que você pode estar confundindo variáveis ​​aleatórias e seus valores. Uma variável aleatória é uma função cujo domínio é o espaço de eventos; não é um número. Em outras palavras, , enquanto que para um , .X : Ω R X { f | f : ohms R } ω ohms X ( ω ) RXX:ΩRX{f | f:ΩR}ωΩX(ω)R

A notação para expectativa condicional, na minha opinião, é muito ruim, porque é uma variável aleatória em si, ou seja, também uma função . Por outro lado, a expectativa (regular) de uma variável aleatória é um número . A expectativa condicional de uma variável aleatória é uma quantidade totalmente diferente da expectativa da mesma variável aleatória, ou seja, nem sequer "verifica o tipo" com .E [ ξ ]E[ξ|G]E[ξ]

Em outras palavras, usar o símbolo para denotar expectativas normais e condicionais é um abuso muito grande de notação, o que leva a muita confusão desnecessária.E

Tudo isso dito, observe que é um número (o valor da variável aleatória avaliada no valor ), mas é uma variável aleatória, mas acaba sendo uma variável aleatória constante (ou seja, degenerada trivial), porque a -algebra gerado por , é trivial / degenerado e, tecnicamente, o valor constante dessa variável aleatória constante é , onde aquiE [E[ξ|G](ω)ω E [ ξ | Ω ] σ Ω { , Ω } E [ ξ ] EE[ξ|G]ωE[ξ|Ω]σΩ{,Ω}E[ξ]E denota expectativa regular e, portanto, um número, não expectativa condicional e, portanto, não é uma variável aleatória.

Além disso, você parece estar confuso sobre o que significa a notação ; tecnicamente falando, só é possível condicionar em álgebras , não em eventos individuais, uma vez que medidas de probabilidade são definidas apenas em álgebras completos , e não em eventos individuais. Assim, é apenas uma abreviação (preguiçosa) para , onde representa a álgebra pelo evento , que é . Observe que ; em outras palavras, ,σ - σ - E [ ξ | A ] E [ ξ | σ ( A ) ] σ ( A ) σE[ξ|A]σσE[ξ|A]E[ξ|σ(A)]σ(A)A { , A , A c , Ω } σ ( A ) = G = σ ( A c ) E [ ξ | A ] EσA{,A,Ac,Ω}σ(A)=G=σ(Ac)E[ξ|A]E [ ξ | A c ]E[ξ|G] e são maneiras diferentes de indicar exatamente o mesmo objeto .E[ξ|Ac]

Finalmente, só quero acrescentar que a explicação intuitiva que dei acima explica por que o valor constante da variável aleatória é apenas o número - a álgebra representa a menor quantidade possível de informações que poderíamos ter, de fato, essencialmente, nenhuma informação; portanto, sob essa circunstância extrema, o melhor palpite possível sobre qual variável aleatória é a variável aleatória constante cujo valor constante é .E [ ξ ] σ - { , Ω } ξ E [ ξ ]E[ξ|Ω]=E[ξ|σ(Ω)]=E[ξ|{,Ω}]E[ξ]σ{,Ω}ξE[ξ]

Observe que todas as variáveis ​​aleatórias constantes são variáveis ​​aleatórias e são todas mensuráveis ​​em relação ao trivial -algebra ; portanto, de fato, temos essa constante aleatória é a projeção ortogonal de no subespaço de consiste em variáveis ​​aleatórias mensuráveis ​​em relação a , como foi reivindicado. σ { , Ω } E [ ξ ] ξ G 2 ( Ω ) { , Ω }L2σ{,Ω}E[ξ]ξL2(Ω){,Ω}

Chill2Macht
fonte
2
@ William Eu discordo de você sobre o uso de como uma var. Muitos livros definem como um número, não uma var. É a melhor estimativa possível de . Esta é uma noção útil e altamente intuitiva. Desconsiderando-o completamente, apenas porque você tem uma noção generalizada de cond exp como uma var var está errado do ponto de vista pedagógico. Não estou confuso sobre o que é um rv, nem vejo como algo que escrevi o levaria a pensar assim. E [ ξ | A ] ξ | UMAE[ξ|A]E[ξ|A]ξ|A
Nicolas Bourbaki
1
@William Pensar em cond expe como uma estimativa do var var com representando informações, é algo que eu já disse antes, mas nunca pensei muito nisso e tentei encontrar uma maneira diferente de visualizar as expectativas. Usando sua sugestão, vou escrever um exemplo simples e publicá-lo como resposta, para mim e para outras pessoas. Talvez algumas pessoas possam elaborar meu exemplo e dar um exemplo mais exótico. G
Nicolas Bourbaki
1
@NicolasBourbaki Eu recomendo que você veja a p.221 da 4ª edição da Probabilidade de Durrett - Teoria e Exemplos . Também posso encaminhá-lo para outras fontes discutindo isso. Em qualquer caso, não é realmente uma questão de opinião - no caso mais geral, uma expectativa condicional é uma variável aleatória e o condicionamento é feito apenas com relação às álgebras ; condicionamento em relação a um evento é condicionamento em relação à álgebra gerada pelo evento, e condicionamento em relação a uma variável aleatória é condicionamento em relação à álgebra gerada pelo RVσ - σσσσ
Chill2Macht
3
@ William E posso encaminhá-lo para fontes que definem o cond. exep. de um evento para ser um número real. Não sei por que você está tão preso nesse ponto. Pode-se definir de qualquer maneira, desde que as noções não sejam confusas. Por razões pedagógicas, ministrar uma aula sobre prob. teoria, e saltar instantaneamente para a definição mais geral, não é esclarecedora. Em ambos os casos, isso realmente não importa nesta discussão, e sua reclamação é sobre notação / semântica.
Nicolas Bourbaki
1
@NicolasBourbaki O capítulo 5 da Probabilidade de Whittle via expectativa fornece um relato muito bom (na minha opinião) de ambas as caracterizações da expectativa condicional e explica bem como cada definição se relaciona e é motivada pela outra definição. Você está certo que a distinção é mais uma semântica. Meu entusiasmo pela definição mais geral deriva (acho) da leitura deste capítulo (5 da Probabilidade de Whittle via Expectativa ), que fez (acredito) bons argumentos sobre como a definição mais geral é, de certa forma, mais fácil de entender.
Chill2Macht 23/03
3

Vou tentar elaborar o que William sugeriu.

Seja o espaço de amostra para jogar uma moeda duas vezes. Defina a execução. var. para ser o num. de cabeças que ocorrem no experimento. Claramente, . Uma maneira de pensar o que , como uma expectativa. value, representa é a melhor estimativa possível para . Se tivéssemos que adivinhar qual seria o valor , adivinharíamos . Isso ocorre porque para qualquer número real .ξ E [ ξ ] = 1ΩξE[ξ]=1ξ ξ 1 E [ ( ξ - 1 ) 2 ] E [ ( ξ - um ) 2 ] um1ξξ1E[(ξ1)2]E[(ξa)2]a

Indique por como o evento em que o primeiro resultado é um cabeçalho. Seja seja o -alg. gen. por . Pensamos em como representando o que sabemos após o primeiro lançamento. Após o primeiro lançamento, as cabeças ocorreram ou as cabeças não ocorreram. Portanto, estamos no evento ou após o primeiro lançamento.G = { , A , A c , Ω } σ A G A A cA={HT,HH}G={,A,Ac,Ω}σAGAAc

Se estamos no evento , a melhor estimativa possível para seria , e se estivermos no evento , a melhor estimativa possível para seria .ξ E [ ξ | A ] = 1,5 A c ξ E [ ξ | A c ] = 0,5AξE[ξ|A]=1.5AcξE[ξ|Ac]=0.5

Agora defina a execução. var. para ser ou , dependendo ou não . Isso correu. var. , é uma aproximação melhor que desde .1,5 0,5η(ω)1.50.5η 1 = E [ ξ ] E [ ( ξ - η ) 2 ] E [ ( ξ - 1 ) 2 ]ωAη1=E[ξ]E[(ξη)2]E[(ξ1)2]

O que está fazendo é fornecer a resposta para a pergunta: qual é a melhor estimativa do após o primeiro lance? Desde que não sabemos a informação após o primeiro lance, dependerá . Depois que o evento é revelado, após o primeiro lançamento, o valor de é determinado e fornece a melhor estimativa possível para . ξ η A G η ξηξηAGηξ

O problema de usar como sua própria estimativa, ou seja, é o seguinte. não está bem definido após o primeiro lançamento. Digamos que o resultado do experimento seja com o primeiro resultado sendo o principal, estamos no evento , mas o que éNão sabemos desde o primeiro lance que esse valor é ambíguo para nós e, portanto, não está bem definido. Mais formalmente, dizemos que não é ou seja, seu valor não está bem definido após o primeiro lançamento. Portanto, é a melhor estimativa possível de0 = E [ ( ξ - ξ ) 2 ] E [ ( ξ - η ) 2ξξ ω A ξ ( ω ) = ? ξ ξ G η ξ0=E[(ξξ)2]E[(ξη)2]ξωAξ(ω)=?ξξGηξ após o primeiro lançamento.

Talvez alguém aqui possa criar um exemplo mais sofisticado usando o espaço de amostra , com e algum trivial não-trivial .ξ ( ω ) = ω G σ[0,1]ξ(ω)=ωGσ

Nicolas Bourbaki
fonte
1

Embora você solicite não usar a definição formal, acho que a definição formal é provavelmente a melhor maneira de explicá-la.

Wikipedia - expectativa condicional :

Em seguida, uma expectativa condicional de X dado , denotada como é qualquer Função mensurável ( ) que satisfaz: E(X H ) H Ω R nHE(XH)HΩRn

HE(XH)dP=HXdPfor eachHH

Primeiramente, é uma função mensurável . Em segundo lugar, ele deve corresponder à expectativa de todos os (sub) conjuntos mensuráveis ​​em . Portanto, para um evento, A, a álgebra sigma é ; portanto, é claramente definida como você especificou na sua pergunta para . Da mesma forma, para qualquer variável aleatória discreta (e combinações delas), listamos todos os eventos primitivos e atribuímos a expectativa, dado esse evento primitivo.H {A,AC,,Ω}ωA/AcHH{A,AC,,Ω}ωA/Ac

Agora considere jogar uma moeda um número infinito de vezes, onde a cada sorteio você recebe , se sua moeda é coroa, então o seu total de ganhos é onde = 1 para caudas e 0 para cabeças. Então X é uma variável aleatória real em . Após n arremessos de moedas, você sabe o valor de X com precisão ; por exemplo, após 2 arremessos de moedas, ele fica em [0,1 / 4], [1 / 4,1 / 2], [1/2, 3/4] ou [3 / 4,1] - após cada sorteio, a álgebra sigma associada está ficando cada vez mais fina e, da mesma forma, a expectativa condicional de X está ficando cada vez mais precisa. X = Σ i = 1 11/2ici[0,1]1/2nX=i=112icici[0,1]1/2n

Esperamos que este exemplo de uma variável aleatória com valor real com uma sequência de álgebras sigma cada vez mais refinadas (Filtração) afaste você da intuição puramente baseada em eventos a que está acostumado e esclareça seu objetivo.

seanv507
fonte
Peço desculpas, mas diminuí a votação desta pergunta. Não responde ao que eu pedi originalmente. Também não fornece nenhuma informação nova que eu não conhecia antes.
Nicolas Bourbaki
O que estou tentando sugerir é que você não entende a definição formal tão bem quanto pensa (como a outra resposta também sugeriu); portanto, a menos que você trabalhe com o que não é intuitivo com a definição formal, você não progredirá.
Seanv507
Eu entendo muito bem a definição formal. As perguntas que fiz, sei como respondê-las ao trabalhar com as definições formais. A 'outra resposta' estava tentando explicar minha pergunta sem usar a definição de con. exp.
Nicolas Bourbaki