Suponha que é uma variável aleatória com pdf . Então a variável aleatória tem o pdf
Eu entendo o cálculo por trás disso. Mas estou tentando pensar em uma maneira de explicar isso para alguém que não conhece cálculo. Em particular, estou tentando explicar por que o fator aparece na frente. Vou dar uma facada nele:
Suponha que tenha uma distribuição gaussiana. Quase todo o peso de seu pdf é entre os valores, digamos, e Mas que mapeia para 0 a 9 para . Assim, o peso pesado no pdf para foi estendida através de uma ampla gama de valores em que a transformação . Assim, para que seja um pdf verdadeiro, o peso extra pesado deve ser reduzido pelo fator multiplicativo
Como isso soa?
Se alguém puder fornecer uma explicação melhor ou criar um link para um documento ou livro, eu apreciaria muito. Acho esse exemplo de transformação variável em vários livros de probabilidades / estatísticas intro-matemáticas. Mas nunca encontro uma explicação intuitiva com ele :(
fonte
Respostas:
PDFs são alturas, mas são usados para representar probabilidade por meio de área. Portanto, ajuda a expressar um PDF de uma maneira que nos lembra que a área é igual à altura vezes a base.
Inicialmente, a altura com qualquer valorx é fornecida pelo PDF fX(x) . A base é o segmento infinitesimal dx , de onde a distribuição (isto é, a medida de probabilidade em oposição à função de distribuição ) é realmente a forma diferencial, ou "elemento de probabilidade".
Este, e não o PDF, é o objeto com o qual você deseja trabalhar conceitual e praticamente, porque inclui explicitamente todos os elementos necessários para expressar uma probabilidade.
Quando reexprimimosx em termos de y=x2 , os segmentos de base dx são esticados (ou espremidos): ao quadrado das duas extremidades do intervalo de x a x+dx , vemos que a base da área y deve ser um intervalo de duração
Como o produto de dois infinitesimais é desprezível comparado aos próprios infinitesimais, concluímos
Tendo estabelecido isso, o cálculo é trivial, porque apenas inserimos a nova altura e a nova largura:
Como a base, em termos dey , é dy , o que quer que se multiplica deve estar a uma altura, que pode ler directamente a partir do meio-termo como
Esta equaçãoPEX(x)=PEY(y) é efetivamente uma lei de conservação da área (= probabilidade).
Este gráfico mostra com precisão partes estreitas (quase infinitesimais) de dois PDFs relacionados pory=x2 . As probabilidades são representadas pelas áreas sombreadas. Devido ao aperto do intervalo [0.32,0.45] via quadratura, a altura da região vermelha ( y , à esquerda) deve ser proporcionalmente expandida para corresponder à área da região azul ( x , à direita).
fonte
Que tal, se eu fabricar objetos que são sempre quadrados e eu sei a distribuição dos comprimentos laterais dos quadrados; o que posso dizer sobre a distribuição das áreas das praças?
Em particular, se eu souber a distribuição de uma variável aleatória , o que posso dizer sobre Y = X 2 ? Uma coisa que você pode dizer éX Y=X2
Portanto, é estabelecida uma relação entre o CDF de e o CDF de X ; qual é a relação entre seus PDFs? Precisamos de cálculo para isso. Tomar as derivadas de ambos os lados fornece os resultados desejados.Y X
fonte
density = prob mass/interval
... o que estou errado?Imagine que temos uma população eY é um resumo dessa população. Então P(Y∈(y,y+Δy)) está contando a proporção de indivíduos que possuem variável Y no intervalo (y,y+Δy) . Você pode considerar isso como um "bin" do tamanho Δy e estamos contando quantos indivíduos estão dentro que Bin.
Agora vamos voltar a expressar esses indivíduos em termos de outra variável,X . Dado que sabemos que Y e X estão relacionados como Y=X2 , o evento Y∈(y,y+Δy) é o mesmo que o evento X2∈(x2,(x+Δx)2) que é igual ao evento X∈(|x|,|x|+Δx) or X∈(−|x|−Δx,−|x|) . Assim, os indivíduos que estão no compartimento(y,y+Δy) também devem estar nos compartimentos(|x|,|x|+Δx) e(−|x|−Δx,−|x|) . Em outras palavras, esses compartimentos devem ter a mesma proporção de indivíduos,
Ok, agora vamos à densidade. Primeiro, precisamos definir o que é uma densidade de probabilidade . Como o nome sugere, é a proporção de indivíduos por área . Ou seja, contamos a parcela de indivíduos nesse compartimento e dividimos pelo tamanho do compartimento . Como estabelecemos que as proporções de pessoas são as mesmas aqui, mas o tamanho das caixas mudou, concluímos que a densidade será diferente. Mas diferente em quanto?
Do nosso resultado anterior, que a população em cada compartimento é a mesma, temos então isso,
fonte