Por que uma função de distribuição cumulativa (CDF) define exclusivamente uma distribuição?

17

Sempre me disseram que um CDF é único, mas um PDF / PMF não é único, por que isso? Você pode dar um exemplo em que um PDF / PMF não é exclusivo?

DKangeyan
fonte
6
Em relação à exclusividade, você pode considerar a diferença entre o PDF de uma distribuição uniforme em e uma distribuição uniforme em seu interior . Outro exercício divertido - que aborda a questão da existência de um PDF - é pensar em como seria o PDF de uma distribuição sobre os números racionais. Por exemplo, vamos sempre que 0 \ lt j2 ^ {- i} \ lt um , i \ ge 1 , e j é impar. [0,1](0,1)Pr(j2i)=212i0<j2i<1i1j
whuber
2
Nem todas as distribuições têm um PDF ou um PMF, enquanto o CDF oferece uma visão unificadora das coisas. Variáveis ​​contínuas têm CDFs com aparência suave, variáveis ​​discretas têm uma "escada" e algumas CDFs são misturadas.
Silverfish 07/02
6
@ Silverfish: ... e alguns não são dos itens acima! :-)
cardeal
3
Para endereçar o título (talvez um tanto vagamente), o CDF define uma distribuição porque o CDF (ou equivalente apenas DF / 'função de distribuição'; o "C" atua apenas para esclarecer que é o objeto sobre o qual estamos falando) é o que o termo denomina 'distribuição' se refere literalmente; o "D" é a pista nessa parte. O fato de ser exclusivo resulta das funções "F" - com valor único; portanto, se duas funções de distribuição são idênticas, o objeto que elas definem é o mesmo; se os DFs diferissem em qualquer lugar, o que eles definem seria diferente nesses pontos. Isso é tautologia? Eu acho que é.
Glen_b -Reinstala Monica
4
@Glen_b É tautológico apenas para a intuição treinada. Uma função de distribuição fornece apenas probabilidades no formato enquanto a distribuição inteira especifica probabilidades no formato para conjuntos mensuráveis ​​arbitrários Você precisa mostrar que determina Como Nicholas B aponta, é uma questão de estender uma pré-medida de um semi-anel (de intervalos semiabertos), , para todo o campo sigma de Lebesgue e mostrando que é únicoF ( x ) = Pr { ω ΩFPr ( { ω ΩF(x)=Pr{ωΩ|X(ω)x}BR F μ ( ( a , b ] ) = F ( b ) - F ( a )Pr({ωΩ|X(ω)B}BRFμ((a,b])=F(b)F(a)
whuber

Respostas:

13

Vamos relembrar algumas coisas. Deixe ser um espaço de probabilidade , é nosso conjunto de amostras, é a -álgebra, e é uma função de probabilidade definida em . Uma variável aleatória é uma função mensurável isto é, para qualquer subconjunto mensurável de Lebesgue em . Se você não está familiarizado com esse conceito, tudo o que digo depois não fará sentido.Ω A σ P A(Ω,A,P)ΩAσPAX - 1 ( S ) A RX:ΩRX1(S)AR

Sempre que temos uma variável aleatória, , ela induz uma medida de probabilidade em pelo push categórico. Em outras palavras, . É trivial verificar que é a medida de probabilidade em . Chamamos da distribuição de .X R X ( S ) = P ( X - 1 ( S ) ) X R X X:ΩRXRX(S)=P(X1(S))XRXX

Agora, relacionado a esse conceito, há algo chamado função de distribuição de uma variável de função. Dada uma variável aleatória , definimos . As funções de distribuição têm as seguintes propriedades:X:ΩRF(x)=P(Xx)F:R[0,1]

  1. F é contínuo contínuo .

  2. F não diminui

  3. F()=1 e F()=0 .

As variáveis ​​aleatórias claramente iguais são iguais e têm a mesma função de distribuição e distribuição.

Inverter o processo e obter uma medida com a função de distribuição fornecida é bastante técnico. Digamos que você receba uma função de distribuição . Defina . Você precisa mostrar que é uma medida na semi-álgebra de intervalos de . Depois, você pode aplicar o Carathéodory teorema da extensão para estender a uma medida de probabilidade em .F(x)μ(a,b]=F(b)F(a)μ(a,b]μR

Nicolas Bourbaki
fonte
4
Este é um bom começo para uma resposta, mas pode estar escondendo acidentalmente um pouco o assunto em questão. A questão principal parece estar mostrando que duas medidas com a mesma função de distribuição são, de fato, iguais. Isso requer nada mais que o teorema de - de Dynkin e o fato de que conjuntos da forma formam um sistema que gera a álgebra de Borel . Em seguida, a não singularidade de uma densidade (assumindo existe!) pode ser abordado e contrastado com o exposto acima.λ ( - , b ] π σπλ(,b]πσ
cardeal
3
(Um outro problema menor: variáveis ​​aleatórias são geralmente definidas em termos de conjuntos de Borel em vez de conjuntos de Lebesgue.) Acho que, com algumas edições menores, essa resposta se tornará bastante clara. :-)
cardeal
@ cardinal Penso em análise em primeiro lugar, probabilidade em segundo. Portanto, isso pode explicar por que prefiro pensar em conjuntos de Lebesgue. Em ambos os casos, isso não afeta o que foi dito.
Nicolas Bourbaki
4

Para responder à solicitação de um exemplo de duas densidades com a mesma integral (ou seja, ter a mesma função de distribuição), considere estas funções definidas nos números reais:

 f(x) = 1 ; when x is odd integer
 f(x) = exp(-x^2)  ; elsewhere

e depois;

 f2(x) = 1  ; when x is even integer
 f2(x) = exp(-x^2) ;  elsewhere

Eles não são iguais a todos os x, mas são ambas densidades para a mesma distribuição; portanto, as densidades não são determinadas exclusivamente pela distribuição (cumulativa). Quando as densidades com um domínio real são diferentes apenas em um conjunto contável de valores x, as integrais serão as mesmas. A análise matemática não é realmente para os fracos de coração ou para a mente determinada concretamente.

DWin
fonte
0

Discordo da afirmação "a função de distribuição de probabilidade não determina exclusivamente uma medida de probabilidade", que você diz na sua pergunta inicial. Ele determina exclusivamente.

Seja duas funções de massa de probabilidade. Se, Para qualquer conjunto mensurável então quase todos os lugares. Isso determina exclusivamente o pdf (porque na análise não nos importamos se eles discordam de um conjunto de medidas zero).f1,f2:R[0,)

Ef1=Ef2
Ef1=f2

Podemos reescrever a integral acima em Onde é uma função integrável.

Eg=0
g=f1f2

Defina , então . Usamos o conhecido teorema de que, se uma integral de uma função não negativa é zero, a função é zero em quase todos os lugares. Em particular, AE em . Então ae em . Agora repita o argumento na outra direção com . Vamos começar esse ae na . Assim, ae em .E={xR | g0}Eg=0g=0Ef1=f2EF={xR | g0}f1=f2Ff1=f2EF=R

Nicolas Bourbaki
fonte