A distribuição normal converge para uma distribuição uniforme quando o desvio padrão cresce para o infinito?

18

A distribuição normal converge para uma determinada distribuição se o desvio padrão cresce sem limites? parece-me que o pdf começa a parecer uma distribuição uniforme com limites dados por . Isso é verdade?[2σ,2σ]

Ramon Martinez
fonte
2
Não, mas para responder sua pergunta corretamente, precisamos saber qual é a sua definição de convergência. Lembre-se de que a discussão formal só é possível quando o lado direito não está mudando. Portanto, você não pode estabelecer convergência para a Unifrom [ ] porque seu está mudando. Olhe-se a formulação de CLT para ver o que quero dizerσ,σσ
Aksakal
somente se você o agrupar ou truncar para algo . o(σ)
enthdegree

Respostas:

4

As outras respostas já aqui fazer um grande trabalho de explicar por que RVs Gauss não convergem para qualquer coisa como os variância aumenta sem limite, mas eu quero salientar uma propriedade aparentemente uniforme que tal coleção de Gaussians faz satisfazer essa eu acho que pode basta que alguém adivinhe que está se tornando uniforme, mas isso acaba por não ser forte o suficiente para concluir isso.

Considere uma coleção de variáveis ​​aleatórias {X1,X2,} que XnN(0,n2) . Seja A=[a1,a2] um intervalo fixo de comprimento finito e, para alguns cR defina B=A+c , ou seja, B é A mas é deslocado por c . Para um intervalo I=[i1,i2] defina len(I)=i2i1 como o comprimento de I e observe que len(A)=len(B) .

Agora vou provar o seguinte resultado:

Resultado : |P(XnA)P(xnB)|0 como n .

Eu chamo isso de uniforme porque diz que a distribuição de tem cada vez mais dois intervalos fixos de comprimento igual, com probabilidade igual, não importa quão distantes estejam. Definitivamente, esse é um recurso muito uniforme, mas, como veremos, isso não diz nada sobre a distribuição real do convergindo para um uniforme.X nXnXn

Pf: observe que onde então Eu posso usar o limite (muito grosseiro) que para obter X 1N ( 0 , 1 ) P ( X nA ) = P ( a 1n X 1a 2 )Xn=nX1X1N(0,1) = 1

P(XnA)=P(a1nX1a2)=P(a1nX1a2n)
e - x 2 / 2
=12πa1/na2/nex2/2dx.
1ex2/21=
12πa1/na2/nex2/2dx12πa1/na2/n1dx
=len(A)n2π.

Eu posso fazer o mesmo para obter P ( X nB ) B

P(XnB)len(B)n2π.

Juntando isso, eu tenho como (estou usando a desigualdade do triângulo aqui).n

|P(XnA)P(XnB)|2len(A)nπ0
n

Como isso difere de convergindo para uma distribuição uniforme? Acabei de provar que as probabilidades dadas a quaisquer dois intervalos fixos de um mesmo comprimento finito se aproximam cada vez mais, e intuitivamente isso faz sentido quando as densidades estão "se achatando" das perspectivas de e A BXnAB

Mas, para convergir para uma distribuição uniforme, eu precisaria de para ser proporcional a para qualquer intervalo , e isso é muito diferente porque isso precisa ser aplicado a qualquer , não apenas a um corrigido com antecedência (e, como mencionado anteriormente, isso também não é possível para uma distribuição com suporte ilimitado).Xnlen ( I ) I IP(XnI)len(I)II

jld
fonte
Certo, você quase poderia dizer que eles convergiram em distribuição, exceto que o limite do que eles convergem é uma distribuição imprópria. Um tipo de convergência que seria bem definido é que eu acho que você poderia mostrar que a métrica de Wasserstein se aproximará de zero como ? σ
Cliff AB
36

Um erro comum de probabilidade é pensar que uma distribuição é uniforme porque parece visualmente plana quando todos os seus valores estão próximos de zero. Isso ocorre porque tendemos a ver que e ainda , ou seja, um pequeno intervalo em torno de é 1000 vezes mais provável que um pequeno intervalo em torno de .f ( x ) / f ( y ) = 0,001 / 0,000001 = 1000 xf(x)=0.0010.000001=f(y)f(x)/f(y)=0.001/0.000001=1000xy

Definitivamente, não é uniforme em toda a linha real no limite, pois não há distribuição uniforme em . Também não é aproximadamente uniforme em .(,)[2σ,2σ]

Você pode ver o último na regra 68-95-99.7 com a qual você parece estar familiarizado. Se fosse aproximadamente uniforme em , a probabilidade de estar em e deve ser a mesma, pois os dois intervalos são os mesmos comprimento. Mas esse não é o caso: , mas .[ 0 , σ ] [ σ , 2 σ ] P ( [ 0 , σ[2σ,2σ][0,σ][σ,2σ]P([0,σ])0.68/2=0.34P([σ,2σ])(0.950.68)/2=0.135

Quando visualizada em toda a linha real, essa sequência de distribuições normais não converge para nenhuma distribuição de probabilidade. Existem algumas maneiras de ver isso. Como exemplo, o cdf de um normal com desvio padrão é e para todo , que não é o cdf de nenhuma variável aleatória, de fato, não é um cdf.σlim σ Fσ(x)=1/2xFσ(x)=(1/2)(1+erf(x/2σ)limσFσ(x)=1/2x

A razão para essa não convergência se resume a "perda de massa" é o limite. A função limitadora da distribuição normal na verdade "perdeu" a probabilidade (isto é, escapou ao infinito). Isso está relacionado ao conceito de rigidez das medidas , que fornece as condições necessárias para que uma sequência de variáveis ​​aleatórias converja para outra variável aleatória.

Alex R.
fonte
1
O incorreto "é" era "todos os seus valores estão próximos de zero". O "Está" em "É um erro comum" estava correto.
Acccumulation
15

Sua declaração de que o pdf começa a parecer uma distribuição uniforme com limites dados por[2σ,2σ] não está correta se você ajustar para corresponder ao desvio padrão mais amplo.σ

Considere este gráfico de duas densidades normais centradas em zero. A curva vermelha corresponde a um desvio padrão de e a curva azul a um desvio padrão de , e é realmente o caso que a curva azul está quase plana em110[2,2]

insira a descrição da imagem aqui

mas para a curva azul com , deveríamos realmente observar sua forma em . O redimensionamento do eixo e eixo por fatores de fornece esse próximo gráfico, e você obtém exatamente a mesma forma para a densidade azul nesse gráfico posterior que a densidade vermelha no gráfico anterior [ - 20 , 20 ] x y 10σ=10[20,20]xy10

insira a descrição da imagem aqui

Henry
fonte
2

Sua pergunta é fundamentalmente falha. A distribuição normal padrão é dimensionada para que . Portanto, para alguma outra distribuição gaussiana ( ), a curva entre os limites tem a mesma forma da distribuição normal padrão. A única diferença é o fator de escala. Portanto, se você redimensionar o gaussiano dividindo por , você terminará com a distribuição normal padrão.σ=1 [ - 2 σ * , 2 σ * ] σ *μ=0,σ=σ[2σ,2σ]σ

Agora, se você tem uma distribuição gaussiana ( ), então sim como , a região entre torna-se cada vez mais plana.σ [ - 2 , 2 ]μ=0,σ=σσ[2,2]

MaxW
fonte