Por que o CDF de uma amostra é distribuído uniformemente

17

Li aqui que, dada uma amostra de uma distribuição contínua com o cdf , a amostra correspondente a segue uma distribuição uniforme padrão.F X U i = F X ( X i )X1,X2,...,XnFXvocêEu=FX(XEu)

Eu verifiquei isso usando simulações qualitativas em Python e pude verificar facilmente o relacionamento.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Resultando no seguinte gráfico:

Gráfico mostrando a amostra de uma distribuição normal e o cdf da amostra.

Não consigo entender por que isso acontece. Suponho que tenha a ver com a definição do CDF e sua relação com o PDF, mas estou perdendo alguma coisa ...

Eu apreciaria se alguém pudesse me indicar alguma leitura sobre o assunto ou me ajudar a ter alguma intuição sobre o assunto.

EDIT: O CDF aparece assim:

CDF da distribuição amostrada

Maxime Tremblay
fonte
2
Calcule o cdf de . FX(X)
Zhanxiong
2
Você encontraria uma prova dessa propriedade (para rv contínuos) em qualquer livro sobre simulação, pois essa é a base do método inverso de simulação em cdf.
Xi'an
2
Pesquisas relacionadas google-ing probabilidade transformada integral
Zachary Blumenfeld
1
@ Xi'an É bom ressaltar que a conclusão é válida apenas para variáveis ​​aleatórias contínuas. Às vezes, esse resultado é usado por engano para variáveis ​​aleatórias discretas. Por outro lado, observe também que muitas provas envolvem a etapa na qual assume a estrita monotonicidade de , que também é uma suposição muito forte. O link a seguir fornece um resumo rigorosa sobre este tema: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfFP(F(X)x)=P(XF-1(x))F
Zhanxiong
@Zhanxiong a única condição necessária para é que ele é càdlàg. F
21815 AdamOu

Respostas:

19

Suponha que seja contínuo e crescente. Defina e observe que aceita valores em . Então FXZ [ 0 , 1 ] F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F - 1 X ( x ) ) = x .Z=FX(X)Z[0 0,1]

FZ(x)=P(FX(X)x)=P(XFX-1(x))=FX(FX-1(x))=x.

Por outro lado, se é uma variável aleatória uniforme que aceita valores em , você[0 0,1]

Fvocê(x)=Rfvocê(você)dvocê=0 0xdvocê=x.

Assim, para cada .FZ(x)=Fvocê(x)x[0 0,1]

Hunaphu
fonte
Segue-se que Z tem uma distribuição uniforme (0, 1)?
StatsSorceress 13/11
8

Intuitivamente, talvez faça sentido pensar em como uma função percentual, por exemplo, espera-se que de uma amostra gerada aleatoriamente a partir do DF fique abaixo de . Alternativamente, (pense em imagens inversas, não uma função inversa adequada por si só ) é uma função "quantil". Ou seja, é o ponto atrás do qual cai proporção da amostra. A composição funcional é mensuravelmente conmutativo .F(x)F(x)FxF-1x=F-1(p)xpFF-1=λF-1F

A distribuição uniforme é a única distribuição que possui uma função quantil igual a uma função percentil: elas são a função de identidade. Portanto, o espaço da imagem é igual ao espaço de probabilidade. mapeia variáveis ​​aleatórias contínuas em um espaço (0, 1) com a mesma medida. Como para quaisquer dois percentis, , temosFuma<bP(F-1(uma)<x<F-1(b))=P(uma<F(X)<b)=b-uma

AdamO
fonte
Eu lutei por horas, mas finalmente entendi por que a variável aleatória derivada é distribuída uniformemente. Sua resposta realmente ajudou, muito obrigado. Parece muito com a álgebra onde 1 era a identidade multiplicativa. Y=F(X)
Aditya P