A distribuição normal converge para uma determinada distribuição se o desvio padrão cresce sem limites? parece-me que o pdf começa a parecer uma distribuição uniforme com limites dados por . Isso é verdade?
normal-distribution
convergence
Ramon Martinez
fonte
fonte
Respostas:
As outras respostas já aqui fazer um grande trabalho de explicar por que RVs Gauss não convergem para qualquer coisa como os variância aumenta sem limite, mas eu quero salientar uma propriedade aparentemente uniforme que tal coleção de Gaussians faz satisfazer essa eu acho que pode basta que alguém adivinhe que está se tornando uniforme, mas isso acaba por não ser forte o suficiente para concluir isso.
Considere uma coleção de variáveis aleatórias{X1,X2,…} que Xn∼N(0,n2) . Seja A=[a1,a2] um intervalo fixo de comprimento finito e, para alguns c∈R defina B=A+c , ou seja, B é A mas é deslocado por c . Para um intervalo I=[i1,i2] defina len(I)=i2−i1 como o comprimento de I e observe que len(A)=len(B) .
Agora vou provar o seguinte resultado:
Resultado :|P(Xn∈A)−P(xn∈B)|→0 como n→∞ .
Eu chamo isso de uniforme porque diz que a distribuição de tem cada vez mais dois intervalos fixos de comprimento igual, com probabilidade igual, não importa quão distantes estejam. Definitivamente, esse é um recurso muito uniforme, mas, como veremos, isso não diz nada sobre a distribuição real do convergindo para um uniforme.X nXn Xn
Pf: observe que onde então Eu posso usar o limite (muito grosseiro) que para obter X 1 ∼ N ( 0 , 1 ) P ( X n ∈ A ) = P ( a 1 ≤ n X 1 ≤ a 2 )Xn=nX1 X1∼N(0,1) = 1
Eu posso fazer o mesmo para obter P ( X n ∈ B ) ≤B
Juntando isso, eu tenho como (estou usando a desigualdade do triângulo aqui).n→∞
Como isso difere de convergindo para uma distribuição uniforme? Acabei de provar que as probabilidades dadas a quaisquer dois intervalos fixos de um mesmo comprimento finito se aproximam cada vez mais, e intuitivamente isso faz sentido quando as densidades estão "se achatando" das perspectivas de e A BXn A B
Mas, para convergir para uma distribuição uniforme, eu precisaria de para ser proporcional a para qualquer intervalo , e isso é muito diferente porque isso precisa ser aplicado a qualquer , não apenas a um corrigido com antecedência (e, como mencionado anteriormente, isso também não é possível para uma distribuição com suporte ilimitado).Xn len ( I ) I IP(Xn∈I) len(I) I I
fonte
Um erro comum de probabilidade é pensar que uma distribuição é uniforme porque parece visualmente plana quando todos os seus valores estão próximos de zero. Isso ocorre porque tendemos a ver que e ainda , ou seja, um pequeno intervalo em torno de é 1000 vezes mais provável que um pequeno intervalo em torno de .f ( x ) / f ( y ) = 0,001 / 0,000001 = 1000 xf(x)=0.001≈0.000001=f(y) f(x)/f(y)=0.001/0.000001=1000 x y
Definitivamente, não é uniforme em toda a linha real no limite, pois não há distribuição uniforme em . Também não é aproximadamente uniforme em .(−∞,∞) [−2σ,2σ]
Você pode ver o último na regra 68-95-99.7 com a qual você parece estar familiarizado. Se fosse aproximadamente uniforme em , a probabilidade de estar em e deve ser a mesma, pois os dois intervalos são os mesmos comprimento. Mas esse não é o caso: , mas .[ 0 , σ ] [ σ , 2 σ ] P ( [ 0 , σ[−2σ,2σ] [0,σ] [σ,2σ] P([0,σ])≈0.68/2=0.34 P([σ,2σ])≈(0.95−0.68)/2=0.135
Quando visualizada em toda a linha real, essa sequência de distribuições normais não converge para nenhuma distribuição de probabilidade. Existem algumas maneiras de ver isso. Como exemplo, o cdf de um normal com desvio padrão é e para todo , que não é o cdf de nenhuma variável aleatória, de fato, não é um cdf.σ lim σ → ∞ Fσ(x)=1/2xFσ(x)=(1/2)(1+erf(x/2–√σ) limσ→∞Fσ(x)=1/2 x
A razão para essa não convergência se resume a "perda de massa" é o limite. A função limitadora da distribuição normal na verdade "perdeu" a probabilidade (isto é, escapou ao infinito). Isso está relacionado ao conceito de rigidez das medidas , que fornece as condições necessárias para que uma sequência de variáveis aleatórias converja para outra variável aleatória.
fonte
Sua declaração de que o pdf começa a parecer uma distribuição uniforme com limites dados por[−2σ,2σ] não está correta se você ajustar para corresponder ao desvio padrão mais amplo.σ
Considere este gráfico de duas densidades normais centradas em zero. A curva vermelha corresponde a um desvio padrão de e a curva azul a um desvio padrão de , e é realmente o caso que a curva azul está quase plana em1 10 [−2,2]
mas para a curva azul com , deveríamos realmente observar sua forma em . O redimensionamento do eixo e eixo por fatores de fornece esse próximo gráfico, e você obtém exatamente a mesma forma para a densidade azul nesse gráfico posterior que a densidade vermelha no gráfico anterior [ - 20 , 20 ] x y 10σ=10 [−20,20] x y 10
fonte
Sua pergunta é fundamentalmente falha. A distribuição normal padrão é dimensionada para que . Portanto, para alguma outra distribuição gaussiana ( ), a curva entre os limites tem a mesma forma da distribuição normal padrão. A única diferença é o fator de escala. Portanto, se você redimensionar o gaussiano dividindo por , você terminará com a distribuição normal padrão.σ=1 [ - 2 σ * , 2 σ * ] σ *μ=0,σ=σ∗ [−2σ∗,2σ∗] σ∗
Agora, se você tem uma distribuição gaussiana ( ), então sim como , a região entre torna-se cada vez mais plana.σ ∗ → ∞ [ - 2 , 2 ]μ=0,σ=σ∗ σ∗→∞ [−2,2]
fonte