Os CDFs são mais fundamentais que os PDFs?

43

Meu professor de estatística disse basicamente que, se receber um dos três seguintes, você poderá encontrar os outros dois:

  • Função de distribuição cumulativa
  • Função Geradora de Momento
  • Função densidade de probabilidade

Mas meu professor de econometria disse que os CDFs são mais fundamentais que os PDFs, porque há exemplos em que você pode ter um CDF, mas o PDF não está definido.

Os CDFs são mais fundamentais que os PDFs? Como sei se um PDF ou MGF pode ser derivado de um CDF?

Stan Shunpike
fonte
23
É algum tipo de concurso de fundamentalidade? Temos um painel de juízes de celebridades? Todos esses três conceitos podem ser usados ​​para definir uma medida em um espaço . No entanto, para um determinado CDF, o MGF e o PDF podem não existir, pois o PDF é definido como um derivado do CDF e o MGF é definido como um , e isso integral não precisa existir. No entanto, isso não significa que qualquer um desses conceitos seja menos fundamental. Fundamental é um bom adjetivo que não tem definição matemática. É sinônimo de importante. R exp(tx)dF(x)RdRexp(tx)dF(x)
mpiktas 25/05
6
@mpiktas: Toda distribuição de probabilidade em (um subconjunto de) possui um CDF e define exclusivamente a distribuição. Porém, nem todas as distribuições de probabilidade possuem um PDF ou um MGF (mas todas elas têm uma função característica ). Rn
Ilmari Karonen
3
@mpiktas Você pode fazê-lo com em . Então não está definido. No entanto, é claro para mim por que o professor usou a expressão "mais fundamental". O adjetivo pode não ter um significado matemático bem definido, mas e daí? .. algum) Inglês também Cada PDF que conhecemos tem um CDF subjacente Aqui "subjacente" tem uma associação agradável com "fundamental" O oposto não é verdade..R P ( ( - , x ] )A={R,}RP((,x])
drhab
2
@drhab, naturalmente eu estava falando sobre o derivado Radon-Nikodym :) Eu também entendo perfeitamente o que o professor tinha em mente, mas na minha opinião é perigoso usar essas expressões com os alunos, porque, em vez de tentar entender a diferença entre os conceitos matemáticos, eles tentam classificá-los de acordo com a fundamentalidade, que é fundamentalmente errada. Chalaça pretendida.
mpiktas 25/05
4
@mpiktas: claro, não há uma definição precisa de "fundamental". Mas há um grande meio termo entre "rigorosamente definido" e "totalmente sem sentido". Em nossa própria matemática, é claro, tudo deve, no final, ser completamente rigoroso, por isso nos acostumamos a dar um tapa em tudo que não é. Mas quando falamos e pensamos em matemática, temos noções subjetivas, mas significativas, como "fundamental", "geral" etc., assim como qualquer outra pessoa; e tudo bem.
PLL

Respostas:

69

Toda distribuição de probabilidade em (um subconjunto de) possui uma função de distribuição cumulativa e define exclusivamente a distribuição. Portanto, nesse sentido, o CDF é realmente tão fundamental quanto a própria distribuição.Rn

Uma função de densidade de probabilidade , no entanto, existe apenas para distribuições de probabilidade (absolutamente) contínuas . O exemplo mais simples de uma distribuição sem PDF é qualquer distribuição de probabilidade discreta , como a distribuição de uma variável aleatória que utiliza apenas valores inteiros.

Obviamente, essas distribuições de probabilidade discretas podem ser caracterizadas por uma função de massa de probabilidade , mas também existem distribuições que não possuem PDF nem PMF, como qualquer mistura de uma distribuição contínua e discreta:

Diagrama de distribuições de probabilidade contínua, discreta e mista
(Diagrama roubado descaradamente da resposta de Glen_b a uma pergunta relacionada.)

Existem distribuições de probabilidade únicas , como a distribuição Cantor , que não podem ser descritas nem por uma combinação de PDF e PMF. Tais distribuições ainda têm um CDF bem definido, no entanto. Por exemplo, aqui está o CDF da distribuição Cantor, também chamado de "escada do diabo":

Distribuição Cantor CDF
( Imagem do Wikimedia Commons pelos usuários Theon e Amirki , usada sob a licença CC-By-SA 3.0 .)

O CDF, conhecido como função Cantor , é contínuo, mas não absolutamente contínuo. De fato, é constante em todos os lugares, exceto em um conjunto Cantor de medida zero da Lebesgue, mas que ainda contém infinitos pontos. Assim, toda a massa probabilística da distribuição Cantor está concentrada nesse subconjunto extremamente pequeno da linha numérica real, mas todos os pontos do conjunto ainda individualmente têm probabilidade zero.


Também existem distribuições de probabilidade que não possuem uma função geradora de momento . Provavelmente, o exemplo mais conhecido é a distribuição de Cauchy , uma distribuição de cauda gorda que não possui momentos bem definidos da ordem 1 ou superior (portanto, em particular, não tendo média ou variação bem definida!).

Todas as distribuições de probabilidade em , no entanto, tem um (possivelmente de valor complexo) função característica ), cuja definição é diferente daquele do FCL apenas por uma multiplicação com a unidade imaginária . Assim, a função característica pode ser considerada tão fundamental quanto o CDF.Rn

Ilmari Karonen
fonte
Você diz que toda distribuição possui CDF, mas nem toda possui PDF, mas, na verdade, existem distribuições que possuem PDFs e não possuem CDFs de formato fechado, por exemplo, multivariada normal.
Tim
13
@ Tim: Isso é verdade, mas apenas com o qualificador "formulário fechado"; o CDF ainda existe, mesmo que não possamos gravá-lo de forma fechada. E, de qualquer forma, a definição de uma " expressão de forma fechada " é notoriamente confusa; por algumas definições estritas, mesmo a distribuição normal univariada não possui um CDF de formato fechado, mas se você considerar a função de erro como sendo de formato fechado, possui.
Ilmari Karonen
11
@ Tim Não é um contra-exemplo. É uma propriedade arbitrária que você escolheu como importante / fundamental para você. Para mim, a propriedade "existe" é mais importante do que "fechou a forma". Mais ainda, "sempre existe" versus "às vezes pode não ter uma forma fechada, como qualquer função".
Ark-kun
3
[0,1]R
11
@ Ark-kun Estou jogando como advogado do diabo aqui, pois há casos em que o PDF é algo mais "diretamente disponível" do que o CDF. Eu gosto desta resposta (+1), mas IMHO, isso é algo que também pode ser mencionado.
Tim
16

Acredito que seu professor de econometria estava pensando algo ao longo das seguintes linhas.

F[0 0,1 1]

F(x)=1 12x para x<1 12
F(x)=1 12x+1 12 para x1 12

[0 0,1 1]

P({1 12})=1 12

f

f

Pela definição de um PDF, devemos ter

0 0xf(t)dt=F(x)-F(0 0)=1 14x

0 0<x<1 12

f(x)=1 14 para x<1 12

x>1 12

f(x)=1 14 para x>1 12

ff(1 12)f(1 12)

P({1 12})=1 12

Nós precisaríamos

1 12-ϵ1 12+ϵf(t)dt>1 12

1 12

1 12-ϵ1 12+ϵf(t)dt=1 12-ϵ1 12+ϵ1 14dt=1 12ϵ

f

Você pode recuperar o espírito de um PDF, mas deve usar objetos matemáticos mais sofisticados, uma medida ou uma distribuição .

Matthew Drury
fonte
3
1 12δ(x-1 12)δ(x)x=0 0
-+δ(x)dx=1 1
2
eu1 1
@IwillnotexistIdonotexist O que whuber disse é o que eu estava sugerindo na última linha. Eu usei a palavra "distribuição".
Matthew Drury
4
1 1/21 1/2
4

Ilmari dá uma boa resposta de uma perspectiva teórica. No entanto, pode-se também perguntar quais propósitos a densidade (pdf) e a função de distribuição (pdf) servem para cálculos práticos. Isso poderia esclarecer para quais situações uma é mais diretamente útil que a outra.

R(-,x]--

A densidade é, no entanto, essencial para as estatísticas, pois a probabilidade é definida em termos da densidade. Portanto, se quisermos calcular a estimativa da máxima probabilidade, precisamos diretamente da densidade.

Se nos voltarmos para a comparação de uma distribuição empírica e uma teórica, ambas podem ser úteis, mas métodos como gráficos de pp e qq baseados na função de distribuição são frequentemente preferidos.

Rdd2

NRH
fonte