Retirado de Grimmet e Stirzaker :
Mostre que não pode ser o caso de U = X + Y, emU=X+Y que é uniformemente distribuído em [0,1] e e são independentes e distribuídos de forma idêntica. Você não deve assumir que X e Y são variáveis contínuas.UUXXYY
Uma prova simples por contradição é suficiente para o caso em que , são assumidos discretos, argumentando que sempre é possível encontrar umXXYY uu e u 'u′ tais que P ( U ≤ u + u ' ) ≥ P ( U ≤ u )P(U≤u+u′)≥P(U≤u) enquanto P ( X + Y ≤ u ) = P ( X + Y ≤ u + u ′ )P(X+Y≤u)=P(X+Y≤u+u′) .
No entanto, essa prova não se estende a X ,X,Y sendo Y absolutamente contínuo ou contínuo singular. Dicas / Comentários / Crítica?
Respostas:
O resultado pode ser comprovado com uma imagem: as áreas cinzentas visíveis mostram que uma distribuição uniforme não pode ser decomposta como uma soma de duas variáveis independentes identicamente distribuídas.
Notação
Seja X e Y iid de tal forma que X + Y tenha uma distribuição uniforme em [ 0 , 1 ] . Isso significa que, para todos os 0 ≤ a ≤ b ≤ 1 ,X Y X+Y [0,1] 0≤a≤b≤1
Pr ( a < X + Y ≤ b ) = b - a .
O suporte essencial da distribuição comum de X e Y é, portanto, [ 0 , 1 / 2 ] (para de outro modo haveria a probabilidade positivo que X + Y está fora [ 0 , 1 ] ).X Y [0,1/2] X+Y [0,1]
A imagem
Vamos 0 < ε < 1 / 4 . Contemple este diagrama mostrando como somas de variáveis aleatórias são calculadas:0<ϵ<1/4
A distribuição de probabilidade subjacente é a distribuição conjunta de ( X , Y ) . A probabilidade de qualquer evento a < X + Y ≤ b é dada pela probabilidade total coberta pela banda diagonal que se estende entre as linhas x + y = a e x + y = b . Três dessas bandas são mostradas: de 0 a ϵ , aparecendo como um pequeno triângulo azul no canto inferior esquerdo; a partir de 1 / 2 - ε a 1 / 2(X,Y) a<X+Y≤b x+y=a x+y=b 0 ϵ 1/2−ϵ + ϵ , mostrado como um retângulo cinza com dois triângulos (amarelo e verde); e de 1 - ϵ a 1 , aparecendo como um pequeno triângulo vermelho no canto superior direito.1/2+ϵ 1−ϵ 1
O que a imagem mostra
Ao comparar o triângulo inferior esquerdo na figura ao quadrado inferior esquerdo que o contém e explorar a suposição iid para X e Y , fica claro queX Y
ε = Pr ( X + Y ≤ ε ) < Pr ( X ≤ ε ) Pr ( Y ≤ ε ) = Pr ( X ≤ ε ) 2 .
Observe que a desigualdade é estrita: a igualdade não é possível porque há alguma probabilidade positiva de que X e Y sejam menores que ϵ, mas, no entanto, X + Y > ϵ .X Y ϵ X+Y>ϵ
Da mesma forma, comparando o triângulo vermelho ao quadrado no canto superior direito,
ε = Pr ( X + Y > 1 - ε ) < Pr ( X > 1 / 2 - ε ) 2 .
Por fim, comparar os dois triângulos opostos na parte superior esquerda e na parte inferior direita da banda diagonal que os contém gera outra desigualdade estrita,
2 ε < 2 Pr ( X ≤ ε ) Pr ( X > 1 / 2 - ε ) < Pr ( 1 / 2 - ε < X + Y ≤ 1 / 2 + ε ) = 2 ε .
Os primeiros Ensues desigualdade das duas anteriores (tomar as suas raízes quadradas e multiplicá-las), enquanto o segundo descreve a inclusão (rigoroso) dos triângulos dentro da banda e a última igualdade expressa a uniformidade de X + Y . A conclusão de que 2 ϵ < 2 ϵ é a contradição que prova que tais X e Y não podem existir, QED .X+Y 2ϵ<2ϵ X Y
fonte
Tentei encontrar uma prova sem considerar as funções características. Excesso de curtose faz o truque. Aqui está a resposta de duas linhas: Kurt ( U ) = Kurt ( X + Y ) = Kurt ( X ) / 2, pois X e Y são iid. Então Kurt ( U ) = - 1,2 implica Kurt ( X ) = - 2,4, o que é uma contradição como Kurt ( X )Kurt(U)=Kurt(X+Y)=Kurt(X)/2 X Y Kurt(U)=−1.2 Kurt(X)=−2.4 ≥ - 2 para qualquer variável aleatória.Kurt(X)≥−2
Mais interessante é a linha de raciocínio que me levou a esse ponto. X (e Y ) deve ser delimitado entre 0 e 0,5 - isso é óbvio, mas útil significa que seus momentos e momentos centrais existem. Vamos começar considerando a média e a variância: E ( U ) = 0,5 e Var ( U ) = 1X Y E(U)=0.5 12 . SeXeYsão distribuídos de forma idêntica, temos:Var(U)=112 X Y
E ( X + Y ) = E ( X ) + E ( Y ) = 2 E ( X ) = 0,5
Então E ( X ) = 0,25 . Para a variação, precisamos adicionalmente usar independência para aplicar:E(X)=0.25
Var ( X + Y ) = Var ( X ) + Var ( Y ) = 2 Var ( X ) = 112
Portanto, Var ( X ) = 124 eσX=1Var(X)=124 2 √6 ×0,204. Uau! Isso é muita variação para uma variável aleatória cujo suporte varia de 0 a 0,5. Mas deveríamos ter esperado isso, já que o desvio padrão não vai escalar da mesma maneira que a média.σX=126√≈0.204
Agora, qual é o maior desvio padrão que uma variável aleatória pode ter se o menor valor que ela puder receber for 0, o maior valor que ela puder receber for 0,5 e a média for 0,25? A coleta de toda a probabilidade em duas massas pontuais nos extremos, distante 0,25 da média, daria claramente um desvio padrão de 0,25. Portanto, nosso σ X é grande, mas não impossível. (Eu esperava mostrar que isso implicava muita probabilidade nas caudas para que X + Y fosse uniforme, mas não consegui chegar a lugar nenhum com isso na parte de trás de um envelope.)σX X+Y
Second moment considerations almost put an impossible constraint on XX so let's consider higher moments. What about Pearson's moment coefficient of skewness, γ1=E(X−μX)3σ3X=κ3κ3/22γ1=E(X−μX)3σ3X=κ3κ3/22 ? This exists since the central moments exist and σX≠0σX≠0 . It is helpful to know some properties of the cumulants, in particular applying independence and then identical distribution gives:
κi(U)=κi(X+Y)=κi(X)+κi(Y)=2κi(X)
This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just κ1=μκ1=μ and κ2=σ2κ2=σ2 .
Then κ3(U)=2κ3(X)κ3(U)=2κ3(X) and (κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2(κ2(U))3/2=(2κ2(X))3/2=23/2(κ2(X))3/2 . The fraction for γ1γ1 cancels to yield Skew(U)=Skew(X+Y)=Skew(X)/√2Skew(U)=Skew(X+Y)=Skew(X)/2–√ . Since the uniform distribution has zero skewness, so does XX , but I can't see how a contradiction arises from this restriction.
So instead, let's try the excess kurtosis, γ2=κ4κ22=E(X−μX)4σ4X−3γ2=κ4κ22=E(X−μX)4σ4X−3 . By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:
Kurt(U)=Kurt(X+Y)=Kurt(X)/2
The uniform distribution has excess kurtosis −1.2−1.2 so we require XX to have excess kurtosis −2.4−2.4 . But the smallest possible excess kurtosis is −2−2 , which is achieved by the Binomial(1,12)Binomial(1,12) Bernoulli distribution.
fonte