Qual é o significado intuitivo por trás da conexão de uma variável aleatória em seu próprio pdf ou cdf?

9

Um pdf é geralmente escrito como , onde o minúsculo é tratado como uma realização ou resultado da variável aleatória que possui esse pdf. Da mesma forma, um cdf é escrito como , que tem o significado . Entretanto, em algumas circunstâncias, como a definição da função score e essa derivação de que o cdf é distribuído uniformemente , parece que a variável aleatória está sendo conectada ao seu próprio pdf / cdf; ao fazer isso, obtemos uma nova variável aleatória oux X F X ( x ) P ( X < x )f(x|θ)xXFX(x)P(X<x)X Z = F X ( X )Y=f(X|θ)Z=FX(X). Acho que não podemos mais chamar isso de pdf ou cdf, já que agora é uma variável aleatória em si mesma e, no último caso, a "interpretação" parece um absurdo para mim.FX(X)=P(X<X)

Além disso, no último caso acima, não tenho certeza de entender a afirmação "o cdf de uma variável aleatória segue uma distribuição uniforme". O cdf é uma função, não uma variável aleatória e, portanto , não possui uma distribuição. Em vez disso, o que tem uma distribuição uniforme é a variável aleatória transformada usando a função que representa seu próprio cdf, mas não vejo por que essa transformação é significativa. O mesmo vale para a função score, onde estamos inserindo uma variável aleatória na função que representa sua própria probabilidade de log.

Venho destruindo meu cérebro há semanas tentando encontrar um significado intuitivo por trás dessas transformações, mas estou presa. Qualquer visão seria muito apreciada!

mai
fonte
4
A notação pode estar confundindo você. Por exemplo, é exatamente tão significativo como a aplicação de qualquer função mensurável para seria. Para uma interpretação correta, você precisará ser muito claro sobre o que é uma variável aleatória . Para qualquer variável aleatória a função para claramente é uma variável aleatória e, portanto, tem uma distribuição(Observe os dois significados distintos do símbolo " " em " .") é uniforme se e somente se tiver uma distribuição contínua. X X : ohms R , Y : ω F X ( X ( ω ) ) ω ohms F Y . X F X ( X ) F Y XFX(X)XX:ΩR,
Y:ωFX(X(ω))
ωΩFY.XFX(X)FYX
whuber
11
Este não é realmente um problema teórico da medida: para entendê-lo, você pode ignorar com segurança todas as referências à "mensurabilidade". Você pode se beneficiar com o estudo de uma pequena teoria dos conjuntos no início de sua carreira de pós-graduação: é aí que a maioria das pessoas aprende o que essa terminologia e notação matemática básica (e onipresente) realmente significam, por isso é melhor não adiar a aprendizagem.
whuber
Talvez uma palavra sobre por que alguém deveria fazer uma coisa louca como esta: inserir um RV em sua própria densidade !!?! Um exemplo: digamos que você queira estimar a densidade de X, poderá medir o quão bom você é, integrando sobre mas isso é “injusto”: você nunca alcançará uma boa aproximação quando não tiver muitos exemplos de dados (ou seja, a densidade real é pequena). Portanto, uma avaliação “justa” seria ponderar o termo pela verdadeira densidade. Isso é mais ou menos o efeito de inserção de RV em suas próprias densidades ...f(x)-fX(x)
Fabian Werner

Respostas:

8

Como você diz, qualquer função (mensurável) de uma variável aleatória é ela própria uma variável aleatória. É mais fácil pensar em e F ( x ) como "qualquer função antiga". Eles só têm algumas propriedades agradáveis. Por exemplo, se X é um RV exponencial padrão, não há nada de particularmente estranho na variável aleatória Y = 1 - e - X Acontece que Y = F X ( X ) . O fato de Y ter uma distribuição uniforme (dado que Xf(x)F(x)X

Y=1eX
Y=FX(X)YXé um RV contínua) pode ser visto para o caso geral, derivando a CDF de .Y

FY(y)=P(Yy)=P(FX(X)y)=P(XFX-1 1(y))=FX(FX-1 1(y))=y

Qual é claramente o CDF de uma variável aleatória . Nota: Esta versão da prova pressupõe que F X ( x ) é estritamente crescente e contínuo, mas não é muito difícil mostrar uma versão mais geral.você(0 0,1 1)FX(x)

Knrumsey
fonte
11
Sua conclusão está incorreta para o aumento estrito de : você assumiu que F XF - 1 X é a identidade - mas esse nem sempre é o caso. FXFXFX-1 1
whuber
Sim obrigado. A variável aleatória claramente deve ser contínua. Estou perdendo alguma coisa agora? X
knrumsey
11
não precisa ser bijetivo. Tomemos, por exemplo, o caso em que opróprio X tem uma distribuição uniforme! O fechamento da imagem de F X precisa ser o intervalo inteiro [ 0 , 1 ] . Essa é essencialmente a definição de uma distribuição contínua. FXXFX[0 0,1 1].
whuber
11

Uma transformação de uma variável aleatória por uma função mensurável T : XY é outra variável aleatória Y = T ( X ) cuja distribuição é dada pela transformação de probabilidade inversa P ( Y A ) = P ( X { x ;XT:XYY=T(X) para todos os conjuntos A tais que { x ;

P(YUMA)=P(X{x;T(x)UMA})=defP(XT-1 1(UMA))
UMA é mensurável sob a distribuição de X .{x;T(x)UMA}X

Essa propriedade se aplica ao caso especial em que é o cdf da variável aleatória X : Y = F X ( X ) é uma nova variável aleatória que realiza suas realizações em [ 0 , 1 ] . Por acaso, Y é distribuído como um U uniforme ( [ 0 , 1 ] ) quando F X é contínuo. (Se F XFX:X[0 0,1 1]XY=FX(X)[0 0,1 1]Yvocê([0 0,1 1])FXFXé descontínuo, o intervalo de não é mais [ 0 , 1 ] . O que é sempre o caso, é que quando L é um Uniforme L ( [ 0 , 1 ] ) , em seguida, F - X ( L ) tem a mesma distribuição que X , onde M - X indica o inverso generalizado de F X . Qual é uma maneira formal de (a) entender variáveis ​​aleatórias como transformações mensuráveis ​​de umY=FX(X)[0 0,1 1]vocêvocê([0 0,1 1])FX-(você)XFX-FX uma vez que X ( ω ) = F - X ( ω ) é uma variável aleatória com o cdf F X e (b)gera variáveis ​​aleatórias apartir de uma determinada distribuição com o cdf F X. )ωΩX(ω)=FX-(ω)FXFX

Para entender o paradoxo de , assuma a representação F X ( x ) = P ( X x ) = x 0 d F X ( x ) = x 0 f X ( x )P(XX) se d λ é a medida dominante ef x X a densidade correspondente. Em seguida, F X ( X ) = X 0 d F X ( x ) = X 0 f X ( x )

FX(x)=P(Xx)=0 0xdFX(x)=0 0xfX(x)dλ(x)
dλfX é uma variável aleatória, pois o limite superior da integral é aleatório. (Esta é a única parte aleatória da expressão.) A aparente contradição em P ( X X ) se deve a uma confusão nas notações. Para ser definido corretamente, são necessárias duas versões independentes da variável aleatória X , X 1 e X 2 ; nesse caso, a variável aleatória F X ( X 1 ) é definida por F X ( X 1 ) = P X 2
FX(X)=0 0XdFX(x)=0 0XfX(x)dλ(x)
P(XX)XX1 1X2FX(X1 1) a probabilidade sendo calculada para a distribuição de X 2 .
FX(X1 1)=PX2(X2X1 1)
X2

fX(X)fXfX(X|θ^(X))/fX(X|θ0 0)χ2

registrofX(X|θ)θ
θ
Eθ0 0[registrofX(X|θ0 0)θ]=registrofX(x|θ0 0)θfX(x|θ0 0)dλ(x)=0 0

[Resposta digitada enquanto @whuber e @knrumsey estavam digitando suas respectivas respostas!]

Xi'an
fonte
FX(X1 1)=P(X2X1 1)
FXXFX(X)
Sim, eu concordo que eles não são a mesma coisa. No primeiro caso, não é um rv, enquanto no segundo caso, é um rv Estou correto?
mai
XFX(X)
θθθ