O pdf, o pmf e o cdf contêm as mesmas informações?

17

O pdf, o pmf e o cdf contêm as mesmas informações?

Para mim, o pdf dá toda a probabilidade a um certo ponto (basicamente a área abaixo da probabilidade).

O pmf fornece a probabilidade de um certo ponto.

O cdf fornece a probabilidade sob um certo ponto.

Então, para mim, o pdf e o cdf têm a mesma informação, mas o pmf não, porque fornece a probabilidade de um ponto xna distribuição.

Kare
fonte

Respostas:

25

Onde é feita uma distinção entre função de probabilidade e densidade *, o pmf se aplica apenas a variáveis ​​aleatórias discretas, enquanto o pdf se aplica a variáveis ​​aleatórias contínuas.

* abordagens formais podem abranger ambos e usar um único termo para eles

O cdf se aplica a quaisquer variáveis ​​aleatórias, incluindo aquelas que não possuem pdf nem pmf.

insira a descrição da imagem aqui

(Uma distribuição mista não é o único caso de uma distribuição que não possui um pdf ou pmf, mas é uma situação razoavelmente comum - por exemplo, considere a quantidade de chuva em um dia ou a quantia paga em reivindicações em uma apólice de seguro de propriedade, que pode ser modelada por uma distribuição contínua inflada a zero)

O cdf para uma variável aleatória forneceP ( X x )XP(Xx)

O pmf para uma variável aleatória discreta fornece .P ( X = x )XP(X=x)

O pdf em si não fornece probabilidades , mas probabilidades relativas; distribuições contínuas não têm probabilidades pontuais. Para obter probabilidades dos PDFs, você precisa integrar durante algum intervalo - ou fazer uma diferença de dois valores de cdf.

É difícil responder à pergunta 'eles contêm a mesma informação' porque depende do que você quer dizer. Você pode ir de pdf para cdf (via integração), e de pmf para cdf (via somatório) e de cdf para pdf (via diferenciação) e de cdf para pmf (via diferenciação), portanto, se existir um pmf ou pdf, contém as mesmas informações que o cdf.

Glen_b -Reinstate Monica
fonte
1
Glen, você poderia ajudar fornecendo algumas referências nas quais eu poderia ler sobre "pdf dando probabilidades relativas"? É muito interessante e não me lembro de ter visto isso nos meus livros. Obrigado.
Alecos Papadopoulos
@Alecos É simplesmente uma explicação (talvez mal formulada) do fato de que, enquanto não é uma probabilidade, uma vez que é a probabilidade de estar em , então pode ser pensada como a razão da probabilidade de que uma variável com densidade esteja a uma distância muito pequena de da proporção em que uma variável com densidade está no mesmo intervalo. Nesse sentido, expressa "probabilidade relativa". f ( x )f(x)( x , x + d x ) f ( x ) / g ( x ) f x gf(x)dx(x,x+dx)f(x)/g(x)fxg
Glen_b -Reinstala Monica
Entendo. Certamente é válido como uma aproximação da razão de probabilidades e certamente presente em funções de densidade empírica, onde as coisas são discretas por necessidade.
Alecos Papadopoulos
10

Os PMFs estão associados a variáveis ​​aleatórias discretas, PDFs com variáveis ​​aleatórias contínuas. Para qualquer tipo de variável aleatória ou aleatória, o CDF sempre existe (e é único), definido como Agora, dependendo do conjunto de suporte da variável aleatória , a densidade (ou função de massa) não precisa existir. (Considere o conjunto de cantores e a função de cantor , o conjunto é definido recursivamente removendo o centro 1/3 do intervalo da unidade e repetindo o procedimento para os intervalos (0, 1/3) e (2/3, 1), etc. A função é definida como , se estiver no conjunto Cantor, e o maior limite inferior no conjunto Cantor, seX C ( x ) = x x x C ( x ) = 0 x < 0 C ( x ) = 1 1 < x C ( x )

FX(x)=P{Xx}.
XC(x)=xxxnão é um membro.) A Função Cantor é uma função de distribuição perfeitamente boa, se você aplicar se e se . Mas esse cdf não tem densidade: é contínuo em todos os lugares, mas sua derivada é 0 quase em todo lugar. Sem densidade em relação a qualquer medida útil.C(x)=0x<0C(x)=11<xC(x)

Portanto, a resposta para sua pergunta é: se existe uma função de densidade ou massa, é um derivado do CDF com relação a alguma medida. Nesse sentido, eles carregam a "mesma informação". MAS, PDFs e PMFs não precisam existir. CDFs devem existir.

Dennis
fonte
2
Dennis, você pode esclarecer o que quer dizer com a frase " Sem densidade em relação a qualquer medida ?" Certamente tem uma densidade (uniforme!) Em relação a si mesma.
cardeal
@ cardinal: Vou tentar, mas não sei se fará sentido, a menos que você tenha estudado alguma análise real. Se você observar alguns livros antigos sobre estatística matemática (por exemplo, Estatística Matemática de Freund ), verá os PMFs chamados de "densidades". O nome "densidade" é justificado pela medida de probabilidade no espaço mensurável é a base do CDF (consulte o comentário de Joel). A densidade é o derivado de Radon-Nikodym de em relação a alguma medida (geralmente medida de Lesbesgue ou medida de contagem). Nesse caso, não possui derivado RN. ( Ω , σ ( Ω ) , μ ) μ C ( x )μ(Ω,σ(Ω),μ)μC(x)
Dennis
3
@ cardinal (continuação): A medida de probabilidade é uniforme no conjunto Cantor, mas essa é uma besta tão estranha que nem tenho certeza de como é a álgebra. Talvez eu devesse ter dito: "Sem densidade em relação a qualquer medida útil". σ
Dennis
2

As outras respostas apontam para o fato de que os CDFs são fundamentais e devem existir, enquanto PDFs e PMFs não são e nem necessariamente existem.

S1

Parece-me que a resposta é que a função fundamental é a medida de probabilidade , que mapeia cada subconjunto (considerado) do espaço amostral para uma probabilidade. Então, quando existem, o CDF, PDF e PMF surgem da medida de probabilidade.

Joel Bosveld
fonte
1
Do jeito que eu vi, a maioria dos livros de texto define "variável aleatória" como um mapeamento de um espaço de amostra para os números reais. Essencialmente, uma "variável aleatória" tem valor real.
11114 Neil G
1
(R,B,F)(Ω,σ(Ω),μ)Ωμ
FX(x)=μ{ω|X(ω)x}.