Conceitualmente, entendo o significado da frase "a área total sob um PDF é 1". Isso significa que as chances de o resultado estar no intervalo total de possibilidades são de 100%.
Mas eu realmente não consigo entender do ponto de vista "geométrico". Se, por exemplo, em um PDF o eixo x representa comprimento, a área total abaixo da curva não se tornaria maior se x fosse medido em mm em vez de km?
Eu sempre tento imaginar como seria a área abaixo da curva se a função fosse achatada em uma linha reta. A altura (posição no eixo y) dessa linha seria a mesma para qualquer PDF ou teria um valor contingente no intervalo no eixo x para o qual a função está definida?
probability
pdf
integral
TheChymera
fonte
fonte
Respostas:
A função densidade de probabilidade é medida em porcentagens por unidade de medida do seu eixo x. Digamos que em um determinado pontox0 seu PDF seja igual a 1000. Isso significa que a probabilidade de x0<x<x0+dx é 1000dx ondedx está em metros. Se você alterar as unidades para centímetros, a probabilidade não deverá mudar para o mesmo intervalo, mas o mesmo intervalo terá 100 centímetros a mais que metros, então1000dx=PDF′(x′0)⋅100dx′ e resolvendo, obtemosPD F′( x′0 0) = PD F( x0 0)100 . Há 100 vezes menos unidades de probabilidade (porcentagens) por centímetro que por metro.
fonte
Isso pode ajudá-lo a perceber que o eixo vertical é medido como uma densidade de probabilidade . Portanto, se o eixo horizontal é medido em km, o eixo vertical é medido como uma densidade de probabilidade "por km". Suponha que desenhemos um elemento retangular em uma grade com 5 "km" de largura e 0,1 "por km" de altura (que você pode preferir escrever como "km - 1 "). A área desse retângulo é de 5 km x 0,1 km - 1 = 0,5. As unidades cancelam e ficamos com apenas uma probabilidade de metade.- 1 - 1
Se você alterou as unidades horizontais para "metros", teria que alterar as unidades verticais para "por metro". O retângulo agora teria 5000 metros de largura e teria uma densidade (altura) de 0,0001 por metro. Você ainda tem uma probabilidade de metade. Você pode ficar perturbado com a aparência esquisita desses dois gráficos na página em comparação um com o outro (um não precisa ser muito maior e mais curto que o outro?), Mas quando você está desenhando fisicamente os gráficos, pode usar escala que você gosta. Olhe abaixo para ver como pouca estranheza precisa estar envolvida.
Você pode considerar útil considerar histogramas antes de passar para as curvas de densidade de probabilidade. De muitas maneiras, eles são análogos. O eixo vertical de um histograma é a densidade de frequência [por unidade]x e as áreas representam frequências, novamente porque as unidades horizontais e verticais se cancelam após a multiplicação. A curva PDF é uma espécie de versão contínua de um histograma, com frequência total igual a uma.
Uma analogia ainda mais próxima é um histograma de frequência relativa - dizemos que esse histograma foi "normalizado", de modo que os elementos de área agora representam proporções do seu conjunto de dados original em vez de frequências brutas, e a área total de todas as barras é uma. As alturas agora são densidades de frequência relativa [por unidade]x . Se um histograma de frequência relativa tiver uma barra que percorre x valores de 20 km a 25 km (portanto, a largura da barra é de 5 km) e tem uma densidade de frequência relativa de 0,1 por km, então essa barra contém uma proporção de 0,5 dos dados. Isso corresponde exatamente à ideia de que um item escolhido aleatoriamente no seu conjunto de dados tem 50% de probabilidade de ficar nessa barra. O argumento anterior sobre o efeito das mudanças nas unidades ainda se aplica: compare as proporções de dados situados na barra de 20 km a 25 km com a da barra de 20.000 a 25.000 metros para essas duas parcelas. Você também pode confirmar aritmeticamente que as áreas de todas as barras somam uma em ambos os casos.
O que eu poderia dizer com minha afirmação de que o PDF é uma "espécie de versão contínua de um histograma"? Vamos pegar uma pequena faixa sob uma curva de densidade de probabilidade, ao longo dos valores de no intervalo [ x , x + δ x ] , para que a faixa tenha δ x de largura e a altura da curva seja aproximadamente constante f ( x ) . Podemos desenhar uma barra dessa altura, cuja área f ( x )x [x,x+δx] δx f( X ) representa a probabilidade aproximada de estar nessa faixa.f( X )δx
Como podemos encontrar a área sob a curva entre e x = b ? Poderíamos subdividir esse intervalo em pequenas tiras e obter a soma das áreas das barras, ∑ f ( x )x = a x = b , que corresponderia à probabilidade aproximada de permanecer no intervalo [ a , b ] . Vemos que a curva e as barras não se alinham com precisão, portanto há um erro em nossa aproximação. Fazendo δ x cada vez menor para cada barra, preenchemos o intervalo com mais e barras mais estreitas, cujo ∑ f ( x )∑ f( X )δx [ a , b ] δx fornece uma estimativa melhor da área.∑ f( X )δx
Para calcular a área com precisão, em vez de assumir que era constante em cada faixa, avaliamos a integral ∫ b a f ( x ) d x , e isso corresponde à probabilidade real de permanecer no intervalo [ a , b ] . A integração em toda a curva fornece uma área total (ou seja, probabilidade total), pela mesma razão que a soma das áreas de todas as barras de um histograma de frequência relativa fornece uma área total (ou seja, proporção total) de uma. A integração é em si uma espécie de versão contínua da soma de uma soma.f( X ) ∫bumaf( x ) dx [ a , b ]
Código R para parcelas
fonte
Você já tem duas respostas, uma excelente por Silverfish , no entanto, acho que uma ilustração pode ser útil aqui, pois você perguntou sobre geometria e "imaginou" essas funções.
Vamos começar com um exemplo simples da distribuição de Bernoulli :
Como os valores são discretos, não há "curva", mas apenas dois pontos; no entanto, a idéia é semelhante: se você deseja conhecer a probabilidade total (área sob a curva), é necessário resumir as probabilidades dos dois resultados possíveis:
0.010 0.028 0.094 0.198 0.260 0.400 0.404 0.292 0.166 0.092 0.044 0.010 0.002
Você também perguntou sobre a distribuição "uniforme" (uniforme) :
fonte
A seguinte ideia-chave foi mencionada em um comentário, mas não em uma resposta existente ...
Uma maneira de entender as propriedades de um PDF é considerar que o PDF e o CDF estão relacionados por integração (cálculo) - e que o CDF possui uma saída monotônica que representa um valor de probabilidade entre 0 e 1.
A área total integrada sem unidade sob a curva PDF não é afetada pelas unidades do eixo X.
Simplificando ...
Se o eixo X aumentar numericamente, devido a uma alteração nas unidades, o eixo Y deverá se tornar menor por um fator linear correspondente .
fonte