Geralmente, uma distribuição de probabilidade sobre variáveis discretas é descrita usando uma função de massa de probabilidade (PMF):
Ao trabalhar com variáveis aleatórias contínuas, descrevemos distribuições de probabilidade usando uma função de densidade de probabilidade (PDF) em vez de uma função de massa de probabilidade.
- Deep Learning por Goodfellow, Bengio e Courville
No entanto, Wolfram Mathworld está usando PDF para descrever a distribuição de probabilidade sobre variáveis discretas:
Isso é um erro? ou isso não importa muito?
Respostas:
Não é um erro: no tratamento formal da probabilidade, via teoria da medida, uma função de densidade de probabilidade é um derivado da medida de probabilidade de interesse, tomada em relação a uma "medida dominante" (também chamada de "medida de referência"). Para distribuições discretas sobre os números inteiros, a função de massa de probabilidade é uma função de densidade em relação à medida de contagem . Como uma função de massa de probabilidade é um tipo específico de função de densidade de probabilidade, algumas vezes você encontrará referências como esta que se referem a ela como uma função de densidade e elas não estão erradas ao se referir a ela dessa maneira.
No discurso comum sobre probabilidade e estatística, muitas vezes evita-se essa terminologia e faz uma distinção entre "funções de massa" (para variáveis aleatórias discretas) e "funções de densidade" (para variáveis aleatórias contínuas), a fim de distinguir distribuições discretas e contínuas. Em outros contextos, onde se está declarando aspectos holísticos da probabilidade, geralmente é melhor ignorar a distinção e se referir a ambas como "funções de densidade".
fonte
treatment
"No tratamento formal de probabilidade" média notação, perspectiva, convenção ou algo mais?Além da resposta mais teórica em termos da teoria da medida, também é conveniente não distinguir entre pmfs e pdfs na programação estatística. Por exemplo, R tem uma variedade de distribuições internas. Para cada distribuição, possui 4 funções. Por exemplo, para a distribuição normal (do arquivo de ajuda):
Usuários R rapidamente se tornam usados para os
d,p,q,r
prefixos. Seria irritante se você tivesse que fazer algo como descartard
e usarm
para, por exemplo, a distribuição binomial. Em vez disso, tudo é como o usuário R esperaria:fonte
scipy.stats
distingue, alguns objetos têm umpdf
método e outros têm umpmf
método. Isso realmente me irrita!