Estou lendo sobre a função quantil, mas não está claro para mim. Você poderia fornecer uma explicação mais intuitiva do que a fornecida abaixo?
Como o cdf é uma função monotonicamente crescente, ele tem um inverso; vamos denotar isso por . Se é o cdf de , então é o valor de tal que ; isso é chamado de quantil F . O valor F ^ {- 1} (0,5) é a mediana da distribuição, com metade da massa de probabilidade à esquerda e metade à direita. Os valores F ^ {- 1} (0,25) e F ^ {- 1} (0,75) são os quartis inferior e superior.F - 1 F X F - 1 ( α ) x α P ( X ≤ x α ) = α α F F - 1 ( 0,5 ) F - 1 ( 0,25 ) F - 1 ( 0,75 )
distributions
cdf
inverse-cdf
quantile-function
Inder Gill
fonte
fonte
Respostas:
Tudo isso pode parecer complicado a princípio, mas é essencialmente sobre algo muito simples.
Por função de distribuição cumulativa, denotamos a função que retorna probabilidades deX serem menores ou iguais a algum valor x ,
Essa função assume como entrada e retorna valores do intervalo (probabilidades) - vamos denotá-los como . O inverso da função de distribuição cumulativa (ou função quantil) diz a você que faria retornar algum valor ,x [ 0 , 1 ] p x F ( x ) px F( X ) p
Isso é ilustrado no diagrama abaixo, que usa a função de distribuição cumulativa normal (e sua inversa) como exemplo.
Exemplo
Como um exemplo simples, você pode usar uma distribuição Gumbel padrão . Sua função de distribuição cumulativa é
e pode ser facilmente invertido: a função de logaritmo natural é uma inversa da função exponencial ; portanto, é instantaneamente óbvio que a função quantil da distribuição de Gumbel é
Como você pode ver, a função quantil, de acordo com seu nome alternativo, "inverte" o comportamento da função de distribuição cumulativa.
Função de distribuição inversa generalizada
Nem toda função tem um inverso. É por isso que a citação a que você se refere diz "função monotonicamente crescente". Lembre-se de que, a partir da definição da função , ela deve atribuir para cada valor de entrada exatamente uma saída. As funções de distribuição cumulativa para variáveis aleatórias contínuas satisfazem essa propriedade, pois estão aumentando monotonicamente. Para variáveis aleatórias discretas, as funções de distribuição cumulativa não são contínuas e crescentes; portanto, usamos funções de distribuição inversa generalizadas que precisam ser não decrescentes. Mais formalmente, a função de distribuição inversa generalizada é definida como
A definição, traduzida para o inglês simples, diz que, para um determinado valor de probabilidadep , estamos procurando por algunsx , que resultem emF( X ) retornando valor maior ou igual ap , mas como pode haver vários valores dex que atendam a essa condição (por exemplo,F( x ) ≥ 0 é verdadeiro paraqualquer x ), então pegamos o menorx deles.
Funções sem inversos
Em geral, não há inversões para funções que podem retornar o mesmo valor para entradas diferentes, por exemplo, funções de densidade (por exemplo, a função de densidade normal padrão é simétrica, portanto, retorna os mesmos valores para- 2 e 2 etc.). A distribuição normal é um exemplo interessante por mais um motivo - é um dos exemplos de funções de distribuição cumulativa que não têm uma inversa de forma fechada . Nem toda função de distribuição cumulativa precisa ter uma inversa de forma fechada ! Felizmente, nesses casos, os inversos podem ser encontrados usando métodos numéricos.
Caso de uso
A função quantil pode ser usada para geração aleatória, conforme descrito em Como o método de transformação inversa funciona?
fonte
Tim teve uma resposta muito completa. Bom trabalho!
Eu gostaria de acrescentar mais um comentário. Nem todas as funções monotonicamente crescentes têm uma função inversa. Na verdade, apenas funções estritamente monotônicas de aumento / redução têm funções inversas.
Para o aumento monotônico de cdf que não é estritamente monotônico, temos uma função quantil que também é chamada de função de distribuição cumulativa inversa. Você pode encontrar mais detalhes aqui .
fonte