Como atualizar bayesiano em dois eventos que ocorrem com a medida zero?

7

Para ilustrar o que quero dizer, considere o seguinte cenário hipotético:

O número favorito de uma pessoa x[1,1] é distribuído aleatoriamente com função de densidade sem átomos f(x).

Além disso, suponha que essa pessoa (depois de perceber qual o seu número favorito x é) chama o valor absoluto deste número favorito, ou seja |x|.

Como observador, você conhece a estrutura, ou seja, a distribuição de xe o comportamento da pessoa. Assim, depois de observar dizer|x|=0.5 você sabe que o número favorito da pessoa é 0,5 ou -0,5.

Mas, como atualizador bayesiano, qual deveria ser sua crença? Faz sentido dizer que você acredita que o número favorito das pessoas é 0,5 com probabilidade

P[x=0.5||x|=0.5]=P[|x|=0.5|x=0.5]f(0.5)f(0.5)+f(0.5)=f(0.5)f(0.5)+f(0.5)?

Suspeito que não, já que qualquer distribuição é equivalente (em vários sentidos) às mudanças nos eventos de medida zero. Mas o que deve ser feito nesse cenário?

Eu pensaria que esse problema surgiria na teoria econômica (jogos de sinalização), mas ainda não encontrei uma referência que lide com esse problema (todas as sugestões aqui também serão muito apreciadas).

abelha
fonte
"qualquer distribuição é equivalente (em vários sentidos) a alterações nos eventos de medida zero" - o que isso significa?
jbowman
Acredito que sua fórmula para a atualização bayesiana esteja correta e eu, como o outro comentarista, não entendo o que você quer dizer com sua afirmação sobre distribuição equivalente?
mlofton
11
O que quero dizer é que em muitos espaços funcionais bem comportados, como LPespaços (às vezes chamado de espaço de Lebesgue), quaisquer duas funções que diferem apenas em um conjunto de medidas zero são consideradas equivalentes. Assim, a funçãof no meu exemplo e g(x)=f(x) E se x0.5 e g(0.5)=2f(0.5)são considerados equivalentes. Isso, porém, obviamente distorceria a probabilidadeP[x=0.5||x|=0.5]se a equação que escrevi estiver correta (o que suspeito que não esteja).
bee
11
@ Bee: É realmente sutil, mas as duas distribuições serão equivalentes em muitos aspectos (por exemplo, CDF, média, variação, etc.). Você acabou de mostrar com inteligência um aspecto em que na verdade não há equivalente.
Cliff AB
11
@ Xi'an: suponha f e f são dois pdfs para distribuições contínuas para RVs X, Xcom f e figual a um conjunto contável de pontos. Em seguida, o CDF paraX e Xsão iguais, o que implica que também será a média, variância, etc. Contudo, a inferência que fazemos com base na observação de elementos no conjunto contável de desacordo entre os dois pdfs não é. Obviamente, como você aponta na sua resposta, a medida desse conjunto é 0, então você pode argumentar que isso não tem nenhuma consequência real.
Cliff AB

Respostas:

4

O paradoxo é da teoria e do condicionamento da medida, e não da inferência bayesiana (e, portanto, você deve modificar o título da pergunta). Para citar Andrei Kolmogorov,

" O conceito de probabilidade condicional em relação a uma hipótese isolada cuja probabilidade é igual a 0 é inadmissível. "

Quando se define a densidade f da variável aleatória X, pode realmente ser qualquer coisa, incluindo a função nula em qualquer conjunto A(1,1)da medida zero. No entanto, parece-me que a explicação mais fácil é que não se pode escolher o conjuntoA a posteriori , que é uma vezX ou |X| é observado como sendo x, de modo a xA. Significando que a observação realx (ou mais precisamente a realização real x da variável aleatória X) tem probabilidade zero de pertencer a A.

Ao definir

P[X=0.5||X|=0.5]=P[|X|=0.5|X=0.5]f(0.5)f(0.5)+f(0.5)=f(0.5)f(0.5)+f(0.5)
(a) a primeira igualdade é uma aplicação incorreta da fórmula de Bayes para conjuntos, uma vez que os conjuntos são de medida zero e (b) condicionam o conjunto de medida zero {ω;|X(ω)|=0.5} deve ser entendido, e não como uma probabilidade condicional, como definir o valor da função
E[IX=|X|||X|=x]
às x=0.5, que não é definido de maneira única, pois a única restrição é a definição de expectativas condicionais como
P[X=|X|]=E{E[IX=|X|||X|]}
Xi'an
fonte
Obrigado pela resposta! Você concorda que o problema geralmente é sobre a mudança entre uma medida sem átomo (dada porf) a uma medida discreta (a parte posterior P[X=x||X|=0.5])? No sentido de que,f é uma medida de Lebesgue absolutamente contínua, mas P[X=x||X|=0.5]não é. Assim, a tradução entre medidas nunca pode ser invariável para medir eventos nulos e, em particular, o teorema de Radon-Nikodym não é aplicável. É como o @CliffAB estava sugerindo, acredito.
bee
Não, não vejo isso como uma explicação. O mesmo poderia ser dito de qualquer distribuição condicional de uma variável discreta condicional em uma absolutamente contínua. E eu não entendo a conexão com o teorema de Radon-Nikodym, receio.
Xi'an