Variável aleatória uniforme como soma de duas variáveis ​​aleatórias

18

Retirado de Grimmet e Stirzaker :

Mostre que não pode ser o caso de U = X + Y, emU=X+Y que é uniformemente distribuído em [0,1] e e são independentes e distribuídos de forma idêntica. Você não deve assumir que X e Y são variáveis ​​contínuas.UUXXYY

Uma prova simples por contradição é suficiente para o caso em que , são assumidos discretos, argumentando que sempre é possível encontrar umXXYY uu e u 'u tais que P ( U u + u ' ) P ( U u )P(Uu+u)P(Uu) enquanto P ( X + Y u ) = P ( X + Y u + u )P(X+Yu)=P(X+Yu+u) .

No entanto, essa prova não se estende a X ,X,Y sendo Y absolutamente contínuo ou contínuo singular. Dicas / Comentários / Crítica?

direitos
fonte
3
Dica : funções características são seus amigos.
cardeal
1
X e Y são iid; portanto, suas funções características devem ser idênticas. Você precisa usar a função característica e não a função geradora de momento - o mgf não é garantido que existe para X, portanto, mostrar que o mgf tem uma propriedade impossível não significa que não existe um X. Todos os RVs têm uma função característica, por isso, se você mostrar que tem uma propriedade impossível, então não existe tal X.
Silverfish
1
Se as distribuições de XX e YY tiverem átomos , diga que P { X = a } = P { Y = a } = b > 0P{X=a}=P{Y=a}=b>0 , então P { X + Y = 2 a } b 2 > 0P{X+Y=2a}b2>0 e, portanto, X + YX+Y não pode ser distribuído uniformemente em [ 0 , 1 ][0,1]. Assim, é desnecessário considerar o caso das distribuições de XX e YY com átomos.
usar o seguinte

Respostas:

13

O resultado pode ser comprovado com uma imagem: as áreas cinzentas visíveis mostram que uma distribuição uniforme não pode ser decomposta como uma soma de duas variáveis ​​independentes identicamente distribuídas.

Notação

Seja X e Y iid de tal forma que X + Y tenha uma distribuição uniforme em [ 0 , 1 ] . Isso significa que, para todos os 0 a b 1 ,XYX+Y[0,1]0ab1

Pr ( a < X + Y b ) = b - a .

Pr(a<X+Yb)=ba.

O suporte essencial da distribuição comum de X e Y é, portanto, [ 0 , 1 / 2 ] (para de outro modo haveria a probabilidade positivo que X + Y está fora [ 0 , 1 ] ).XY[0,1/2]X+Y[0,1]

A imagem

Vamos 0 < ε < 1 / 4 . Contemple este diagrama mostrando como somas de variáveis ​​aleatórias são calculadas:0<ϵ<1/4

Figure

A distribuição de probabilidade subjacente é a distribuição conjunta de ( X , Y ) . A probabilidade de qualquer evento a < X + Y b é dada pela probabilidade total coberta pela banda diagonal que se estende entre as linhas x + y = a e x + y = b . Três dessas bandas são mostradas: de 0 a ϵ , aparecendo como um pequeno triângulo azul no canto inferior esquerdo; a partir de 1 / 2 - ε a 1 / 2(X,Y)a<X+Ybx+y=ax+y=b0ϵ1/2ϵ+ ϵ , mostrado como um retângulo cinza com dois triângulos (amarelo e verde); e de 1 - ϵ a 1 , aparecendo como um pequeno triângulo vermelho no canto superior direito.1/2+ϵ1ϵ1

O que a imagem mostra

Ao comparar o triângulo inferior esquerdo na figura ao quadrado inferior esquerdo que o contém e explorar a suposição iid para X e Y , fica claro queXY

ε = Pr ( X + Y ε ) < Pr ( X ε ) Pr ( Y ε ) = Pr ( X ε ) 2 .

ϵ=Pr(X+Yϵ)<Pr(Xϵ)Pr(Yϵ)=Pr(Xϵ)2.

Observe que a desigualdade é estrita: a igualdade não é possível porque há alguma probabilidade positiva de que X e Y sejam menores que ϵ, mas, no entanto, X + Y > ϵ .XYϵX+Y>ϵ

Da mesma forma, comparando o triângulo vermelho ao quadrado no canto superior direito,

ε = Pr ( X + Y > 1 - ε ) < Pr ( X > 1 / 2 - ε ) 2 .

ϵ=Pr(X+Y>1ϵ)<Pr(X>1/2ϵ)2.

Por fim, comparar os dois triângulos opostos na parte superior esquerda e na parte inferior direita da banda diagonal que os contém gera outra desigualdade estrita,

2 ε < 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε ) = 2 ε .

2ϵ<2Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ)=2ϵ.

Os primeiros Ensues desigualdade das duas anteriores (tomar as suas raízes quadradas e multiplicá-las), enquanto o segundo descreve a inclusão (rigoroso) dos triângulos dentro da banda e a última igualdade expressa a uniformidade de X + Y . A conclusão de que 2 ϵ < 2 ϵ é a contradição que prova que tais X e Y não podem existir, QED .X+Y2ϵ<2ϵXY

whuber
fonte
3
(+1) Eu gosto dessa abordagem. Recuperando meu verso do envelope do cesto de papéis, posso ver que desenhei o mesmo diagrama, exceto que não marquei os triângulos amarelo e verde dentro da faixa. Eu obtive as desigualdades para os triângulos azul e vermelho. Eu brinquei com eles e algumas outras probabilidades, mas nunca pensei em investigar a probabilidade da tira, que acaba sendo o passo crítico. Eu me pergunto que processo de pensamento pode ter motivado esse insight?
quer
De fato, onde @whuber possui triângulos amarelos e verdes, desenhei quadrados (decompostei efetivamente [ 0 , 0,5 ] 2 em uma grade). Olhando para o passo que "descreve a inclusão (rigoroso) dos triângulos dentro da banda", 2 Pr ( X ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y 1 / 2 + ε )[0,0.5]22Pr(Xϵ)Pr(X>1/2ϵ)<Pr(1/2ϵ<X+Y1/2+ϵ), Gostaria de saber se isso seria geometricamente mais natural com quadrados cobrindo a banda do que triângulos.
quer
1
@ Silver Me lembrei de uma análise das somas de distribuições uniformes que publiquei alguns anos atrás. Isso sugeriu visualizar a soma X + Y geometricamente. Foi de imediato evidente que uma grande quantidade de probabilidade teve de ser concentrada perto dos cantos ( 0 , 0 ) e ( 1 / 2 , 1 / 2 ) , a fim da soma a ser uniforme e para relativamente pouca probabilidade de estar perto da diagonal centro X + Y = 1 / 2 . Isso levou ao diagrama, que redefinei no Mathematica.X+Y(0,0)(1/2,1/2)X+Y=1/2Nesse ponto, a resposta se escreveu. Sim, o uso de quadrados na faixa central pode ser mais limpo.
whuber
Obrigado! "Note-se que a desigualdade é rigorosa: igualdade não é possível porque existe alguma probabilidade positiva que qualquer um de X ou Y é inferior a ε mas, no entanto, X + Y > ε ." Não tenho certeza se sigo isso. Parece-me o objetivo aqui é mostrar Pr ( X + Y £ ) < Pr ( X £ Y £ ) , não esta exigem uma probabilidade positiva para algum evento A em que ambos X eXYϵX+Y>ϵPr(X+Yϵ)<Pr(XϵYϵ)A XY é menor ou igual a ϵ e ainda X + Y > ϵ ? É o "qualquer um" vs "ambos" estou vacilando. YϵX+Y>ϵ
Silverfish
@ Silverfish Obrigado; Não expressei isso como pretendia. Você está correto: a linguagem pretende essencialmente descrever a parte de um pequeno quadrado que não está dentro do triângulo.
whuber
10

Tentei encontrar uma prova sem considerar as funções características. Excesso de curtose faz o truque. Aqui está a resposta de duas linhas: Kurt ( U ) = Kurt ( X + Y ) = Kurt ( X ) / 2, pois X e Y são iid. Então Kurt ( U ) = - 1,2 implica Kurt ( X ) = - 2,4, o que é uma contradição como Kurt ( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2XYKurt(U)=1.2Kurt(X)=2.4- 2 para qualquer variável aleatória.Kurt(X)2

Mais interessante é a linha de raciocínio que me levou a esse ponto. X (e Y ) deve ser delimitado entre 0 e 0,5 - isso é óbvio, mas útil significa que seus momentos e momentos centrais existem. Vamos começar considerando a média e a variância: E ( U ) = 0,5 e Var ( U ) = 1XYE(U)=0.512 . SeXeYsão distribuídos de forma idêntica, temos:Var(U)=112XY

E ( X + Y ) = E ( X ) + E ( Y ) = 2 E ( X ) = 0,5

E(X+Y)=E(X)+E(Y)=2E(X)=0.5

Então E ( X ) = 0,25 . Para a variação, precisamos adicionalmente usar independência para aplicar:E(X)=0.25

Var ( X + Y ) = Var ( X ) + Var ( Y ) = 2 Var ( X ) = 112

Var(X+Y)=Var(X)+Var(Y)=2Var(X)=112

Portanto, Var ( X ) = 124 eσX=1Var(X)=1242 6 ×0,204. Uau! Isso é muita variação para uma variável aleatória cujo suporte varia de 0 a 0,5. Mas deveríamos ter esperado isso, já que o desvio padrão não vai escalar da mesma maneira que a média.σX=1260.204

Agora, qual é o maior desvio padrão que uma variável aleatória pode ter se o menor valor que ela puder receber for 0, o maior valor que ela puder receber for 0,5 e a média for 0,25? A coleta de toda a probabilidade em duas massas pontuais nos extremos, distante 0,25 da média, daria claramente um desvio padrão de 0,25. Portanto, nosso σ X é grande, mas não impossível. (Eu esperava mostrar que isso implicava muita probabilidade nas caudas para que X + Y fosse uniforme, mas não consegui chegar a lugar nenhum com isso na parte de trás de um envelope.)σXX+Y

Second moment considerations almost put an impossible constraint on XX so let's consider higher moments. What about Pearson's moment coefficient of skewness, γ1=E(XμX)3σ3X=κ3κ3/22γ1=E(XμX)3σ3X=κ3κ3/22? This exists since the central moments exist and σX0σX0. It is helpful to know some properties of the cumulants, in particular applying independence and then identical distribution gives:

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)

This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just κ1=μκ1=μ and κ2=σ2κ2=σ2.

Then κ3(U)=2κ3(X)κ3(U)=2κ3(X) and (κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2. The fraction for γ1γ1 cancels to yield Skew(U)=Skew(X+Y)=Skew(X)/2Skew(U)=Skew(X+Y)=Skew(X)/2. Since the uniform distribution has zero skewness, so does XX, but I can't see how a contradiction arises from this restriction.

So instead, let's try the excess kurtosis, γ2=κ4κ22=E(XμX)4σ4X3γ2=κ4κ22=E(XμX)4σ4X3. By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

Kurt(U)=Kurt(X+Y)=Kurt(X)/2

The uniform distribution has excess kurtosis 1.21.2 so we require XX to have excess kurtosis 2.42.4. But the smallest possible excess kurtosis is 22, which is achieved by the Binomial(1,12)Binomial(1,12) Bernoulli distribution.

Silverfish
fonte
2
(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.
cardinal
@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...
Silverfish
@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that Kurt(X1+...+Xn)=1nKurt(X)Kurt(X1+...+Xn)=1nKurt(X) for iid XiXi, (2) that Kurt(U)=1.2Kurt(U)=1.2 for any uniform distribution, and (3) Kurt(X)Kurt(X) exists since XX is bounded and σX0σX0 (which is trivial, else σU=0σU=0). So none of the key results actually required centering, though bits may have looked less ugly!
Silverfish
Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.
cardinal
@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g. fT(t)=12t2fT(t)=12t2 on [-0.5, 0.5], then Var(T)=.15Var(T)=.15 and if T=X1+X2T=X1+X2 then σX=.15/20.27>0.25σX=.15/20.27>0.25 which is impossible as XX is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.
Silverfish