Variável aleatória uniforme como soma de duas variáveis aleatórias

Retirado de Grimmet e Stirzaker :

Mostre que não pode ser o caso de $U=X+Y$ que é uniformemente distribuído em [0,1] e e são independentes e distribuídos de forma idêntica. Você não deve assumir que X e Y são variáveis contínuas. $U$ $X$ $Y$

Uma prova simples por contradição é suficiente para o caso em que , são assumidos discretos, argumentando que sempre é possível encontrar um $X$ $Y$ $u$ e $u'$ tais que $P(U\leq u+u') \geq P(U\leq u)$ enquanto $P(X+Y \leq u) = P(X+Y \leq u+u')$ .

No entanto, essa prova não se estende a $X,Y$ sendo absolutamente contínuo ou contínuo singular. Dicas / Comentários / Crítica?

probability random-variable continuous-data uniform proof direitos
fonte

Dica : funções características são seus amigos.

cardeal

X e Y são iid; portanto, suas funções características devem ser idênticas. Você precisa usar a função característica e não a função geradora de momento - o mgf não é garantido que existe para X, portanto, mostrar que o mgf tem uma propriedade impossível não significa que não existe um X. Todos os RVs têm uma função característica, por isso, se você mostrar que tem uma propriedade impossível, então não existe tal X.

Silverfish

Se as distribuições de

X $X$ e

Y $Y$ tiverem átomos , diga que

P{X=a}=P{Y=a}=b>0 $P\{X=a\}=P\{Y=a\} = b > 0$ , então

P{X+Y=2a}≥b2>0 $P\{X+Y=2a\} \geq b^2 > 0$ e, portanto,

X+Y $X+Y$ não pode ser distribuído uniformemente em

[0,1] $[0,1]$ . Assim, é desnecessário considerar o caso das distribuições de

X $X$ e

Y $Y$ com átomos.

usar o seguinte

Respostas:

O resultado pode ser comprovado com uma imagem: as áreas cinzentas visíveis mostram que uma distribuição uniforme não pode ser decomposta como uma soma de duas variáveis independentes identicamente distribuídas.

Notação

Seja e iid de tal forma que tenha uma distribuição uniforme em . Isso significa que, para todos os , $X$ $Y$ $X+Y$ $[0,1]$ $0\le a \le b \le 1$

Pr (a < X + Y \leq b) = b - a .

$\Pr(a < X+Y \le b) = b-a.$

O suporte essencial da distribuição comum de e é, portanto, (para de outro modo haveria a probabilidade positivo que está fora ). $X$ $Y$ $[0,1/2]$ $X+Y$ $[0,1]$

A imagem

Vamos . Contemple este diagrama mostrando como somas de variáveis aleatórias são calculadas: $0 \lt \epsilon \lt 1/4$

A distribuição de probabilidade subjacente é a distribuição conjunta de . A probabilidade de qualquer evento é dada pela probabilidade total coberta pela banda diagonal que se estende entre as linhas e . Três dessas bandas são mostradas: de a , aparecendo como um pequeno triângulo azul no canto inferior esquerdo; a partir de a $(X,Y)$ $a \lt X+Y \le b$ $x+y=a$ $x+y=b$ $0$ $\epsilon$ $1/2-\epsilon$ , mostrado como um retângulo cinza com dois triângulos (amarelo e verde); e de a , aparecendo como um pequeno triângulo vermelho no canto superior direito. $1/2+\epsilon$ $1-\epsilon$ $1$

O que a imagem mostra

Ao comparar o triângulo inferior esquerdo na figura ao quadrado inferior esquerdo que o contém e explorar a suposição iid para e , fica claro que $X$ $Y$

ϵ = Pr (X + Y \leq ϵ) < Pr (X \leq ϵ) Pr (Y \leq ϵ) = Pr (X \leq ϵ) 2 .

$\epsilon = \Pr(X+Y \le \epsilon) \lt \Pr(X \le \epsilon)\Pr(Y \le \epsilon) = \Pr(X \le \epsilon)^2.$

Observe que a desigualdade é estrita: a igualdade não é possível porque há alguma probabilidade positiva de que e sejam menores que mas, no entanto, . $X$ $Y$ $\epsilon$ $X+Y \gt \epsilon$

Da mesma forma, comparando o triângulo vermelho ao quadrado no canto superior direito,

ϵ = Pr (X + Y > 1 - ϵ) < Pr (X > 1 / 2 - ϵ) 2 .

$\epsilon = \Pr(X+Y \gt 1-\epsilon) \lt \Pr(X \gt 1/2-\epsilon)^2.$

Por fim, comparar os dois triângulos opostos na parte superior esquerda e na parte inferior direita da banda diagonal que os contém gera outra desigualdade estrita,

2 ϵ < 2 Pr (X \leq ϵ) Pr (X > 1 / 2 - ϵ) < Pr (1 / 2 - ϵ < X + Y \leq 1 / 2 + ϵ) = 2 ϵ .

$2\epsilon \lt 2 \Pr(X\le \epsilon)\Pr(X \gt 1/2-\epsilon) \lt \Pr(1/2-\epsilon \lt X+Y \le 1/2+\epsilon) = 2\epsilon.$

Os primeiros Ensues desigualdade das duas anteriores (tomar as suas raízes quadradas e multiplicá-las), enquanto o segundo descreve a inclusão (rigoroso) dos triângulos dentro da banda e a última igualdade expressa a uniformidade de . A conclusão de que é a contradição que prova que tais e não podem existir, QED . $X+Y$ $2\epsilon \lt 2\epsilon$ $X$ $Y$

whuber
fonte

(+1) Eu gosto dessa abordagem. Recuperando meu verso do envelope do cesto de papéis, posso ver que desenhei o mesmo diagrama, exceto que não marquei os triângulos amarelo e verde dentro da faixa. Eu obtive as desigualdades para os triângulos azul e vermelho. Eu brinquei com eles e algumas outras probabilidades, mas nunca pensei em investigar a probabilidade da tira, que acaba sendo o passo crítico. Eu me pergunto que processo de pensamento pode ter motivado esse insight?

quer

De fato, onde @whuber possui triângulos amarelos e verdes, desenhei quadrados (decompostei efetivamente

em uma grade). Olhando para o passo que "descreve a inclusão (rigoroso) dos triângulos dentro da banda",

[0,0.5]2 $[0, 0.5]^2$

2Pr(X≤ϵ)Pr(X>1/2−ϵ)<Pr(1/2−ϵ<X+Y≤1/2+ϵ) $2 \Pr(X\le \epsilon)\Pr(X \gt 1/2-\epsilon) \lt \Pr(1/2-\epsilon \lt X+Y \le 1/2+\epsilon)$ , Gostaria de saber se isso seria geometricamente mais natural com quadrados cobrindo a banda do que triângulos.

quer

@ Silver Me lembrei de uma análise das somas de distribuições uniformes que publiquei alguns anos atrás. Isso sugeriu visualizar a soma

geometricamente. Foi de imediato evidente que uma grande quantidade de probabilidade teve de ser concentrada perto dos cantos

, a fim da soma a ser uniforme e para relativamente pouca probabilidade de estar perto da diagonal centro

. Isso levou ao diagrama, que redefinei no Mathematica.X+Y $X+Y$

(0,0) $(0,0)$

(1/2,1/2) $(1/2,1/2)$

X+Y=1/2 $X+Y=1/2$ Nesse ponto, a resposta se escreveu. Sim, o uso de quadrados na faixa central pode ser mais limpo.

whuber

Obrigado! "Note-se que a desigualdade é rigorosa: igualdade não é possível porque existe alguma probabilidade positiva que qualquer um de

é inferior a

mas, no entanto,

." Não tenho certeza se sigo isso. Parece-me o objetivo aqui é mostrar

, não esta exigem uma probabilidade positiva para algum evento

em que ambos

eX $X$

Y $Y$

ϵ $\epsilon$

X+Y>ϵ $X+Y \gt \epsilon$

Pr(X+Y≤ϵ)<Pr(X≤ϵ∩Y≤ϵ) $\Pr(X+Y \le \epsilon) \lt \Pr(X \le \epsilon \cap Y \le \epsilon)$

A $A$

X $X$

é menor ou igual a

e ainda

? É o "qualquer um" vs "ambos" estou vacilando. Y $Y$

ϵ $\epsilon$

X+Y>ϵ $X + Y > \epsilon$

Silverfish

@ Silverfish Obrigado; Não expressei isso como pretendia. Você está correto: a linguagem pretende essencialmente descrever a parte de um pequeno quadrado que não está dentro do triângulo.

whuber

Tentei encontrar uma prova sem considerar as funções características. Excesso de curtose faz o truque. Aqui está a resposta de duas linhas: pois e são iid. Então implica que é uma contradição como $\text{Kurt}(U) = \text{Kurt}(X + Y) = \text{Kurt}(X) / 2$ $X$ $Y$ $\text{Kurt}(U) = -1.2$ $\text{Kurt}(X) = -2.4$ para qualquer variável aleatória. $\text{Kurt}(X) \geq -2$

Mais interessante é a linha de raciocínio que me levou a esse ponto. (e ) deve ser delimitado entre 0 e 0,5 - isso é óbvio, mas útil significa que seus momentos e momentos centrais existem. Vamos começar considerando a média e a variância: e $X$ $Y$ $\mathbb{E}(U)=0.5$ . Seesão distribuídos de forma idêntica, temos: $\text{Var}(U)=\frac{1}{12}$ $X$ $Y$

E (X + Y) = E (X) + E (Y) = 2 E (X) = 0.5

$\mathbb{E}(X + Y) = \mathbb{E}(X) + \mathbb{E}(Y) = 2 \mathbb{E}(X)= 0.5$

Então . Para a variação, precisamos adicionalmente usar independência para aplicar: $\mathbb{E}(X) = 0.25$

Var (X + Y) = Var (X) + Var (Y) = 2 Var (X) = 1 12

$\text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) = 2 \text{Var}(X) = \frac{1}{12}$

Portanto, e $\text{Var}(X) = \frac{1}{24}$ . Uau! Isso é muita variação para uma variável aleatória cujo suporte varia de 0 a 0,5. Mas deveríamos ter esperado isso, já que o desvio padrão não vai escalar da mesma maneira que a média. $\sigma_X = \frac{1}{2\sqrt{6}} \approx 0.204$

Agora, qual é o maior desvio padrão que uma variável aleatória pode ter se o menor valor que ela puder receber for 0, o maior valor que ela puder receber for 0,5 e a média for 0,25? A coleta de toda a probabilidade em duas massas pontuais nos extremos, distante 0,25 da média, daria claramente um desvio padrão de 0,25. Portanto, nosso é grande, mas não impossível. (Eu esperava mostrar que isso implicava muita probabilidade nas caudas para que fosse uniforme, mas não consegui chegar a lugar nenhum com isso na parte de trás de um envelope.) $\sigma_X$ $X + Y$

Second moment considerations almost put an impossible constraint on $X$ so let's consider higher moments. What about Pearson's moment coefficient of skewness, $\gamma_1 = \frac{\mathbb{E}(X - \mu_X)^3}{\sigma_X^3} = \frac{\kappa_3}{\kappa_2^{3/2}}$ ? This exists since the central moments exist and $\sigma_X \neq 0$ . It is helpful to know some properties of the cumulants, in particular applying independence and then identical distribution gives:

κ i (U) = κ i (X + Y) = κ i (X) + κ i (Y) = 2 κ i (X)

$\kappa_i(U) = \kappa_i(X + Y) = \kappa_i(X) + \kappa_i(Y) = 2\kappa_i(X)$

This additivity property is precisely the generalisation of how we dealt with the mean and variance above - indeed, the first and second cumulants are just $\kappa_1 = \mu$ and $\kappa_2 = \sigma^2$ .

Then $\kappa_3(U) = 2\kappa_3(X)$ and $\big(\kappa_2(U)\big)^{3/2} = \big(2\kappa_2(X)\big)^{3/2} = 2^{3/2} \big(\kappa_2(X)\big)^{3/2}$ . The fraction for $\gamma_1$ cancels to yield $\text{Skew}(U) = \text{Skew}(X + Y) = \text{Skew}(X) / \sqrt{2}$ . Since the uniform distribution has zero skewness, so does $X$ , but I can't see how a contradiction arises from this restriction.

So instead, let's try the excess kurtosis, $\gamma_2 = \frac{\kappa_4}{\kappa_2^2} = \frac{\mathbb{E}(X - \mu_X)^4}{\sigma_X^4} - 3$ . By a similar argument (this question is self-study, so try it!), we can show this exists and obeys:

Kurt (U) = Kurt (X + Y) = Kurt (X) / 2

$\text{Kurt}(U) = \text{Kurt}(X + Y) = \text{Kurt}(X) / 2$

The uniform distribution has excess kurtosis $-1.2$ so we require $X$ to have excess kurtosis $-2.4$ . But the smallest possible excess kurtosis is $-2$ , which is achieved by the $\text{Binomial}(1, \frac{1}{2})$ Bernoulli distribution.

Silverfish
fonte

(+1) This is a quite clever approach, which was new to me. Thanks. Note that some of your analysis could have been streamlined by considering a uniform centered at zero. (The equivalence of the problem is immediate.) That would have immediately told you that considering skew was a dead-end.

cardinal

@cardinal: I knew the skew was a dead-end before I worked on it. The purpose was expository: it's a self-study question so I didn't want to solve it in full! Rather I wanted to leave a hint on how to deal with the next level up...

Silverfish

@cardinal: I was in two minds whether to center or not. I did back-of-envelope calculations more conveniently, but in the final analysis we just need (1) a simple case of the general result that

Kurt(X1+...+Xn)=1nKurt(X) $Kurt(X_1 + ... + X_n) = \frac{1}{n}Kurt(X)$ for iid

Xi $X_i$ , (2) that

Kurt(U)=−1.2 $Kurt(U) = -1.2$ for any uniform distribution, and (3)

Kurt(X) $Kurt(X)$ exists since

X $X$ is bounded and

σX≠0 $\sigma_X \neq 0$ (which is trivial, else

σU=0 $\sigma_U = 0$ ). So none of the key results actually required centering, though bits may have looked less ugly!

Silverfish

Yes, the word "streamlined" was carefully chosen. :-) I did not intend my comment to be read as criticism of your exposition. Cheers.

cardinal

@cardinal Incidentally, variance considerations alone almost worked, but the uniform isn't quite spread out enough. With a bit more probability mass nearer the extremes, e.g.

fT(t)=12t2 $f_T(t)=12t^2$ on [-0.5, 0.5], then

Var(T)=.15 $Var(T)=.15$ and if

T=X1+X2 $T = X_1 + X_2$ then

σX=.15/2−−−−√≈0.27>0.25 $\sigma_X = \sqrt{.15/2} \approx 0.27 > 0.25$ which is impossible as

X $X$ is bounded by -0.25 and 0.25. Of course, you will see immediately how this relates to the present example! I wonder if the approach generalises, I'm sure other bounded RVs can't be decomposed into sums but require even higher moments investigated to find the contradiction.

Silverfish

Variável aleatória uniforme como soma de duas variáveis ​​aleatórias

Respostas:

Notação

A imagem

O que a imagem mostra

Variável aleatória uniforme como soma de duas variáveis aleatórias