Wolfram Mathworld comete um erro ao descrever uma distribuição de probabilidade discreta com uma função de densidade de probabilidade?

14

Geralmente, uma distribuição de probabilidade sobre variáveis ​​discretas é descrita usando uma função de massa de probabilidade (PMF):

Ao trabalhar com variáveis ​​aleatórias contínuas, descrevemos distribuições de probabilidade usando uma função de densidade de probabilidade (PDF) em vez de uma função de massa de probabilidade.

- Deep Learning por Goodfellow, Bengio e Courville

No entanto, Wolfram Mathworld está usando PDF para descrever a distribuição de probabilidade sobre variáveis ​​discretas:

insira a descrição da imagem aqui

Isso é um erro? ou isso não importa muito?

czlsws
fonte
5
Isso é desleixado, na minha opinião, mas não muito importante. É até defensável se eles abordarem a probabilidade do ponto de vista da teoria da medida, embora isso pareça um pouco demais para uma introdução ao lançamento de uma moeda. (Bastante estranho, eles não parecem ter um artigo sobre PMFs.)
Dave
9
um PMF é uma densidade contra a medida de contagem
Xian
3
Quando você discute a teoria da probabilidade no nível de espaço de medida especificado por 3 elementos, pdf e pmf não são diferentes, portanto, o pmf é descartado. Todas as distribuições podem ser especificadas em pdf. O wolfram é um site de matemática, portanto, não é surpresa que eles usem matemática de alto nível para falar sobre probabilidade. Aqui está uma boa leitura gratuita. stat.washington.edu/~pdhoff/courses/581/LectureNotes/…
user158565

Respostas:

30

Não é um erro: no tratamento formal da probabilidade, via teoria da medida, uma função de densidade de probabilidade é um derivado da medida de probabilidade de interesse, tomada em relação a uma "medida dominante" (também chamada de "medida de referência"). Para distribuições discretas sobre os números inteiros, a função de massa de probabilidade é uma função de densidade em relação à medida de contagem . Como uma função de massa de probabilidade é um tipo específico de função de densidade de probabilidade, algumas vezes você encontrará referências como esta que se referem a ela como uma função de densidade e elas não estão erradas ao se referir a ela dessa maneira.

No discurso comum sobre probabilidade e estatística, muitas vezes evita-se essa terminologia e faz uma distinção entre "funções de massa" (para variáveis ​​aleatórias discretas) e "funções de densidade" (para variáveis ​​aleatórias contínuas), a fim de distinguir distribuições discretas e contínuas. Em outros contextos, onde se está declarando aspectos holísticos da probabilidade, geralmente é melhor ignorar a distinção e se referir a ambas como "funções de densidade".

Restabelecer Monica
fonte
Obrigado pela sua resposta. Faz treatment"No tratamento formal de probabilidade" média notação, perspectiva, convenção ou algo mais?
czlsws
Quando falo aqui sobre o "tratamento formal", estou me referindo à base moderna da teoria das probabilidades, que é um subconjunto da teoria das medidas. Essa é a teoria matemática que é aceita como base formal da probabilidade.
Reponha Monica
"uma função de densidade de probabilidade é uma derivada da medida de probabilidade de interesse" Parece-me que, em certo sentido, é mais uma "anti-integral" do que uma derivada. Existem PDFs descontínuos, como a distribuição uniforme, e distribuições discretas podem ser tratadas como somas das funções delta do Dirac. Nesses casos, seria necessário generalizar o conceito de derivado muito além do entendimento comum para sua aplicação.
Acumulação
@ Acumulação - como a distribuição uniforme é descontínua? ... e a teoria da medida é um tratamento muito mais geral de integração e diferenciação do que o entendimento comum do Calc I e II fornece.
21419 jbowman
@ Acumulação: Sim, é uma caracterização justa e, de fato, é isso que é feito. Tecnicamente, a densidade é um derivado de Radon-Nikodym , que é realmente um tipo de "anti-integral" do tipo que você descreve.
Reintegrar Monica
5

Além da resposta mais teórica em termos da teoria da medida, também é conveniente não distinguir entre pmfs e pdfs na programação estatística. Por exemplo, R tem uma variedade de distribuições internas. Para cada distribuição, possui 4 funções. Por exemplo, para a distribuição normal (do arquivo de ajuda):

dnorm gives the density, pnorm gives the distribution function, qnorm gives the quantile function, and rnorm generates random deviates.

Usuários R rapidamente se tornam usados ​​para os d,p,q,rprefixos. Seria irritante se você tivesse que fazer algo como descartar de usar mpara, por exemplo, a distribuição binomial. Em vez disso, tudo é como o usuário R esperaria:

dbinom gives the density, pbinom gives the distribution function, qbinom gives the quantile function and rbinom generates random deviates.
John Coleman
fonte
3
scipy.statsdistingue, alguns objetos têm um pdfmétodo e outros têm um pmfmétodo. Isso realmente me irrita!
Matthew Drury