Dados os N valores amostrados, o que significa o "p-ésimo quantil dos valores amostrados"?
Em teoria (com ), significa o ponto em uma fração acima da distribuição cumulativa. Na prática, existem várias definições usadas, particularmente na computação estatística. Por exemplo, em R, existem nove definições diferentes , as três primeiras para uma interpretação discreta e o restante para uma variedade de interpolações contínuas.
Aqui está um exemplo: se sua amostra é {400, 1, 1000, 40} e você está procurando o quantil 0,6 (percentil 60), os diferentes métodos de cálculo fornecem
> for (t in 1:9) { x[t] <- quantile(c(400, 1, 1000, 40), probs=0.6, type = t ) }
> x
60%
400 400 40 184 364 400 328 376 373
Minha opinião pessoal é que o número correto é que 400 está correto, pois Isso vem do tratamento da amostra como população e, se o CDF empírico for desenhado, será uma sequência de etapas. Existem argumentos opostos para a interpolação, de modo que o CDF empírico seja contínuo, como provavelmente uma aproximação melhor ou mais útil à população, e o método de interpolação afetará o resultado.