Explicação intuitiva para a densidade da variável transformada?

37

Suponha que é uma variável aleatória com pdf . Então a variável aleatória tem o pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Eu entendo o cálculo por trás disso. Mas estou tentando pensar em uma maneira de explicar isso para alguém que não conhece cálculo. Em particular, estou tentando explicar por que o fator aparece na frente. Vou dar uma facada nele:1y

Suponha que tenha uma distribuição gaussiana. Quase todo o peso de seu pdf é entre os valores, digamos, e Mas que mapeia para 0 a 9 para . Assim, o peso pesado no pdf para foi estendida através de uma ampla gama de valores em que a transformação . Assim, para que seja um pdf verdadeiro, o peso extra pesado deve ser reduzido pelo fator multiplicativoX33.YXYfY(y)1y

Como isso soa?

Se alguém puder fornecer uma explicação melhor ou criar um link para um documento ou livro, eu apreciaria muito. Acho esse exemplo de transformação variável em vários livros de probabilidades / estatísticas intro-matemáticas. Mas nunca encontro uma explicação intuitiva com ele :(

lowndrul
fonte
Eu acho que sua explicação está correta.
highBandWidth 18/08
2
A explicação está certa, mas é puramente qualitativa: a forma precisa do fator multiplicativo ainda é um mistério. O poder -1/2 simplesmente aparece magicamente. Assim, em algum nível, você deve fazer o mesmo que o Cálculo: encontre a taxa de alteração da função de raiz quadrada.
whuber

Respostas:

37

PDFs são alturas, mas são usados ​​para representar probabilidade por meio de área. Portanto, ajuda a expressar um PDF de uma maneira que nos lembra que a área é igual à altura vezes a base.

Inicialmente, a altura com qualquer valor x é fornecida pelo PDF fX(x) . A base é o segmento infinitesimal dx , de onde a distribuição (isto é, a medida de probabilidade em oposição à função de distribuição ) é realmente a forma diferencial, ou "elemento de probabilidade".

PEX(x)=fX(x)dx.

Este, e não o PDF, é o objeto com o qual você deseja trabalhar conceitual e praticamente, porque inclui explicitamente todos os elementos necessários para expressar uma probabilidade.

Quando reexprimimos x em termos de y=x2 , os segmentos de base dx são esticados (ou espremidos): ao quadrado das duas extremidades do intervalo de x a x+dx , vemos que a base da área y deve ser um intervalo de duração

dy=(x+dx)2x2=2xdx+(dx)2.

Como o produto de dois infinitesimais é desprezível comparado aos próprios infinitesimais, concluímos

dy=2xdx, whence dx=dy2x=dy2y.

Tendo estabelecido isso, o cálculo é trivial, porque apenas inserimos a nova altura e a nova largura:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Como a base, em termos de y , é dy , o que quer que se multiplica deve estar a uma altura, que pode ler directamente a partir do meio-termo como

12yfX(y)=fY(y).

Esta equação PEX(x)=PEY(y) é efetivamente uma lei de conservação da área (= probabilidade).

Dois pdfs

Este gráfico mostra com precisão partes estreitas (quase infinitesimais) de dois PDFs relacionados por y=x2 . As probabilidades são representadas pelas áreas sombreadas. Devido ao aperto do intervalo [0.32,0.45] via quadratura, a altura da região vermelha ( y , à esquerda) deve ser proporcionalmente expandida para corresponder à área da região azul ( x , à direita).

whuber
fonte
2
Eu amo infinitesimais. Esta é uma explicação maravilhosa. Pensar em termos de , que pode ser claramente visto emergir da derivada da transformação, é muito mais intuitivo do que pensar em termos de 2x . Eu acho que é onde estava o meu ponto de discórdia. y
lowndrul
@ Whuber, eu acredito que você primeira linha deve ser ? É isso que você quer dizer com pdf X ( x ) ? PS: também curioso sobre o que você pensa sobre a minha resposta (abaixo). P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli 15/09
@Carlos É um pouco mais rigoroso expressar a ideia da maneira que fiz no início: o PDF é o que você multiplica a medida de Lebesgue por para obter a medida de probabilidade fornecida. dx
whuber
@ whuber mas se o pdf é o que você multiplica, então é o termo , não o produto f x ( x ) d x como você escreveu, certo? Não está claro por que você chama o produto f X ( x ) d x de pdf. fX(x)fx(x)dxfX(x)dx
Carlos Cinelli 16/09
11
@ Carlos: obrigado; agora entendo o seu ponto. Fiz algumas edições para resolver isso.
whuber
11

Que tal, se eu fabricar objetos que são sempre quadrados e eu sei a distribuição dos comprimentos laterais dos quadrados; o que posso dizer sobre a distribuição das áreas das praças?

Em particular, se eu souber a distribuição de uma variável aleatória , o que posso dizer sobre Y = X 2 ? Uma coisa que você pode dizer éXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

Portanto, é estabelecida uma relação entre o CDF de e o CDF de X ; qual é a relação entre seus PDFs? Precisamos de cálculo para isso. Tomar as derivadas de ambos os lados fornece os resultados desejados.YX

schenectady
fonte
2
(+1) Embora essa não seja uma resposta completa, ela apresenta uma boa maneira de encontrar e mostra claramente por que é uma soma de duas partes, uma para cada raiz quadrada. fY
whuber
11
Não entendo por que pdf (x) = f (x) dx. E quanto ao pdf (x) dx = f (x), density = prob mass/interval... o que estou errado?
7303 Fernando
2

Imagine que temos uma população e Y é um resumo dessa população. Então P(Y(y,y+Δy)) está contando a proporção de indivíduos que possuem variável Y no intervalo (y,y+Δy) . Você pode considerar isso como um "bin" do tamanho Δy e estamos contando quantos indivíduos estão dentro que Bin.

Agora vamos voltar a expressar esses indivíduos em termos de outra variável, X . Dado que sabemos que Y e X estão relacionados como Y=X2 , o evento Y(y,y+Δy) é o mesmo que o evento X2(x2,(x+Δx)2) que é igual ao evento X(|x|,|x|+Δx) or X(|x|Δx,|x|) . Assim, os indivíduos que estão no compartimento(y,y+Δy) também devem estar nos compartimentos(|x|,|x|+Δx) e(|x|Δx,|x|) . Em outras palavras, esses compartimentos devem ter a mesma proporção de indivíduos,

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Ok, agora vamos à densidade. Primeiro, precisamos definir o que é uma densidade de probabilidade . Como o nome sugere, é a proporção de indivíduos por área . Ou seja, contamos a parcela de indivíduos nesse compartimento e dividimos pelo tamanho do compartimento . Como estabelecemos que as proporções de pessoas são as mesmas aqui, mas o tamanho das caixas mudou, concluímos que a densidade será diferente. Mas diferente em quanto?

YfY(y):=P(Y(y,y+Δy))ΔyXfX(x): =P(X(x,x+Δx))Δx

Do nosso resultado anterior, que a população em cada compartimento é a mesma, temos então isso,

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Carlos Cinelli
fonte