Estou aprendendo sobre a função de distribuição cumulativa empírica. Mas eu ainda não entendo
Por que é chamado de 'empírico'?
Existe alguma diferença entre o CDF empírico e o CDF?
distributions
terminology
cdf
ecdf
Gammaries
fonte
fonte
Respostas:
SejaX uma variável aleatória.
A distinção é qual medida de probabilidade é usada. Para o CDF empírico, você usa a medida de probabilidade definida pelas contagens de frequência em uma amostra empírica.
Exemplo simples (troca de moeda):
SejaX uma variável aleatória que denota o resultado de um único lançamento de moeda, onde X= 1 indica cara e X= 0 indica coroa.
O CDF para uma moeda justa é dado por:F( x ) = ⎧⎩⎨⎪⎪0 0121para x < 0para 0 ≤ x < 1para 1 ≤ x
Se você inverte 2 cabeças e 1 cauda, o CDF empírico seria:G ( x ) = ⎧⎩⎨⎪⎪0 0231para x < 0para 0 ≤ x < 1para 1 ≤ x
O CDF empírica iria refletir que, em sua amostra,2 / 3 dos seus flips eram cabeças.
Outro exemplo (F é CDF para distribuição normal):
SejaX uma variável aleatória distribuída normalmente com média 0 0 e desvio padrão 1 .
O CDF é dado por:
Com sorteios suficientes de IID (e certas condições de regularidade são atendidas), o CDF empírico convergiria para o CDF subjacente da população.
fonte
Sim, eles são diferentes. Um cdf empírico é um cdf adequado, mas os cdfs empíricos sempre serão discretos, mesmo quando não extraídos de uma distribuição discreta, enquanto o cdf de uma distribuição pode ser outras coisas além de discreto.
Se você tratar uma amostra como se fosse uma população de valores, cada um igualmente provável (ou seja, coloque a probabilidade 1 / n em cada observação), o cdf dessa distribuição seria o ECDF dos dados.
É uma estimativa da população cdf com base na amostra; especificamente, se você tratar as proporções da amostra em cada valor de dados distinto e tratá-lo como se fosse uma probabilidade na população, receberá o ECDF.
Empírico tem um significado parecido com "pela observação, e não pela teoria", e é exatamente isso que significa neste caso ... usar as observações para determinar a função de distribuição.
fonte
O CDF empírico é construído a partir de um conjunto de dados real (no gráfico abaixo, usei 100 amostras de uma distribuição normal padrão). O CDF é uma construção teórica - é o que você veria se pudesse colher infinitas amostras.
O CDF empírico geralmente se aproxima muito bem do CDF, especialmente para amostras grandes (de fato, existem teoremas sobre a rapidez com que converge para o CDF à medida que o tamanho da amostra aumenta).
fonte
Empírico é algo que você constrói a partir de dados e observações. Por exemplo, suponha que você queira saber sobre a distribuição da altura das pessoas em um país. Você começa medindo pessoas e cria um histograma que pode ser aproximado a uma distribuição. Então você calcula o CDF empírico.
Se você estiver usando uma distribuição estatística (uma fórmula determinística que fornece exatamente a mesma saída com os mesmos parâmetros), também poderá calcular seu CDF.
fonte
Segundo o Dictionary.com , as definições de "empírico" incluem:
Portanto, o CDF empírico é o CDF que você obtém dos seus dados. Isso contrasta com o CDF teórico (geralmente chamado de "CDF"), obtido a partir de um modelo estatístico ou probabilístico, como a distribuição Normal.
fonte