Calcular um percentil é o mesmo que avaliar uma função de densidade cumulativa?

8

Estou tentando pular da idéia de um percentil, digamos, sobre a linha do número real (onde o n-ésimo percentil é simplesmente a posição na qual n% dos pontos de dados estão abaixo dele e 100-n% estão acima dele ), à ideia da área sob uma função de densidade de probabilidade.

Se eu quiser conhecer o percentil 50% de um conjunto de números, encontrarei o ponto em que metade dos números está abaixo, metade dos números está acima. Esse é o percentil de 50%, e pronto.

Se eu quiser conhecer o percentil 50% de uma distribuição, digamos, um Z-score, avaliarei o cdf de 0 a 50 e pronto. Estou dizendo isso correto?

Isso parece intuitivo, mas preciso de alguma discussão para enfatizar isso. Ou, eu poderia estar completamente ...

Matt O'Brien
fonte

Respostas:

5

Você está perto, mas não exatamente certo. Lembre-se de que a área sob uma distribuição de probabilidade deve somar 1. A função de densidade cumulativa (CDF) é uma função com valores em [0,1], pois o CDF é definido como onde f (x) é a função de densidade de probabilidade. O percentil 50 é a probabilidade total de 50% das amostras, o que significa o ponto em que o CDF atinge 0,5. Ou, em termos mais gerais, o percentil é o ponto em que o CDF atinge p / 100.

F(uma)=-umaf(x)dx
goker
fonte
3
Talvez valha a pena apontar o quão perto o OP chegou - em vez de "avaliar um CDF", eles deveriam avaliar um CDF inverso .
Silverfish
1
tão perto e tão longe ... :)
Matt O'Brien
Em geral, o inverso de um CDF (no sentido usual, ou seja, inverso de uma função) pode não existir. Devemos considerar o chamado inverso generalizado (ou pseudo-inverso) de um CDF.
Danny Pak-Keung Chan
1

Não. Essencialmente, calcular um percentil (ou um p-quantil) é equivalente a encontrar o inverso de um CDF.

Observe que o inverso, no sentido usual, de um CDF pode não existir e a noção de inverso generalizado deve ser introduzida. Para tornar a discussão precisa, esclarecemos todas as definições.

F:[-,][0 0,1]

  1. x,y[-,]x<yF(x)F(y)

  2. (Continuidade direita) Para qualquer umaRF(uma)=limxuma+F(x)

  3. F(-)=limx-F(x)=0 0

  4. F()=limxF(x)=1

FEunv1FEunv2F

Eunv1F:[0 0,1][-,]Eunv1F(x)=inf{yF(y)x},

Eunv2F:[0 0,1][-,]Eunv2F(x)=inf{yF(y)>x}

inf()=

p[0 0,1]pEunv1F(p)

Obviamente, se é estritamente crescente e contínuo, ambas as versões do inverso generalizado são iguais e reduzem-se ao inverso usual da funçãoFF-1:[0 0,1][-,].

Para mais informações: https://people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdf

Danny Pak-Keung Chan
fonte