A prova de Bernoulli é o limite do Beta

7

É claro para mim, pela inspeção, que se corrigirmos (assim, fixar a média) e deixar , a distribuição Beta se aproxima de um Bernoulli ( ) distribuição.β=1μμαα0μ

Por exemplo:

par(mfrow = c(1, 2),
    oma = c(0, 0, 1.5, 0))
xx = seq(0, 1, length.out = 1000)
mus = c(.2, .7)
for (ii in 1:2) {
  mu = mus[ii]
  matplot(xx, sapply(10^(-1:-5), function(al) 
    pbeta(xx, al, (1-mu)/mu * al)),
    type = 'l', lty = ii,
    main = paste('Mean:', mu),
    ylab = 'Cumulative Probability', xlab = 'x')
}
title('Beta Approaches Bernoulli', outer = TRUE)

insira a descrição da imagem aqui

Ou seja, se XB(α,1μμα), seu CDF FX(x;α,μ)satisfaz

limα0FX(x;α,μ)=1μ=FY(x)x(0,1)

Onde Bernoulli ( ) e a convergência não são uniformes. Tentei fazer uma prova mais formal disso, mas não consegui fazer nenhum progresso, mesmo em casos simples (como ). A página da Wikipedia na Beta faz referência ao caso várias vezes sem prova. Talvez eu esteja perdendo algo fácil de fazer a integral ou algum fato sobre a função Beta / Beta incompleta. Qualquer ajuda seria apreciada!Yμμ=12μ=12

MichaelChirico
fonte
11
Minha resposta em stats.stackexchange.com/a/237849/919 implica isso, porque mostra que as probabilidades de limite serão concentradas em e . Veja o segundo par de gráficos lá para uma ilustração. 01
whuber

Respostas:

7

A análise pode ser um pouco confusa, principalmente se realizada com rigor total e elementar, mas a ideia é simples e fácil de entender. Concentre-se em pequenas regiões muito próximas de e . À medida que e aproximam de , quase toda a probabilidade de uma distribuição Beta fica localizada nessas regiões. Ao reduzir os tamanhos das regiões, vemos que a distribuição limitadora, se existir, pode ser apenas uma distribuição de Bernoulli. Podemos criar uma distribuição limitadora apenas tornando a abordagem ratio uma constante, exatamente como descrito na pergunta.01αβ0(α,β)α:β

O bom dessa análise é que olhar para áreas relativas evita qualquer necessidade de considerar o comportamento da constante de normalização, uma função Beta . Esta é uma simplificação considerável. (Evitar a função Beta é semelhante em espírito à minha análise dos quantis de distribuição Beta em Dois quantis de uma distribuição beta determinam seus parâmetros? )B(α,β)

Um outro recurso dessa análise é aproximar a função Beta incompleta por integrais simples da forma para constantes . Isso reduz tudo às operações mais elementares de cálculo e desigualdades algébricas.tcdtc>1


O PDF beta é proporcional aConsidere small e examine as contribuições para a área sob dentro dos três intervalos , e como e cresce pequeno (mas permanece positivo).

f(x)=xα1(1x)β1.
ϵ>0f(0,ϵ](ϵ,1ϵ)[1ϵ,1)αβ

Eventualmente, e serão menores que : , portanto, terão pólos em e , assim:αβ1f01

figura 1

O gráfico de é a linha azul superior. Comparados a ele, estão os gráficos de (curva vermelha, com um polo apenas em ) e (curva de ouro, com um polo apenas em ) .fxα10(1x)β11

O que acontece com as três áreas sob , relativas uma à outra, no limite?f

Por uma questão de notação, escreva para a área sob o gráfico de entre e . Estou perguntando sobre os tamanhos relativos de , e .

F(x)=0xf(t)dt=0xtα1(1t)β1dt
f0xF(ϵ)F(1ϵ)F(ϵ)F(1)F(1ϵ)

Vamos estimar essas áreas uma de cada vez, assumindo sempre e e . Sob essas suposições0<α<10<β<1, 0<x<1,0<ϵ<1/2

xα1>1;(1x)β1>1,

xxα1 (vermelho) é uma função decrescente em e (dourado) é uma função crescente. x,x(1x)β1

  1. À esquerda, parece que as curvas azul e vermelha se aproximam. De fato, para , as desigualdades anteriores rendem os limitesA integração de cada um entre e é simples e pressiona entre dois limites próximos,0<x<ϵ

    xα1<xα1(1x)β1<xα1(1ϵ)β1.
    0ϵF(ϵ)
    (1)ϵαα<F(ϵ)<(1ϵ)β1ϵαα.
  2. A mesma análise se aplica ao lado direito, produzindo um resultado semelhante.

  3. Como é côncavo, no intervalo do meio ele atinge seus valores extremos nos pontos finais. Consequentemente, a área é menor que a do trapézio medido por esses pontos:f[ϵ,1ϵ]

    (2)F(1ϵ)F(ϵ)<12(f(ϵ)+f(1ϵ))(1ϵϵ)=12ϵ2(ϵα1(1ϵ)β1+(1ϵ)α1ϵβ1)).

Embora isso ameace ficar confuso, vamos corrigir temporariamente e considerar o que acontece com a razão como e aproximam-se de . Nas expressões e , ambos e abordarão . Assim, os únicos termos que importam no limite sãoϵ(F(1ϵ)F(ϵ)):F(ϵ)αβ0(1)(2)(1ϵ)α1(1ϵ)β1(1ϵ)0=1

(3)F(1ϵ)F(ϵ)F(ϵ)(ϵα1+ϵβ1)/2ϵα/α=α2ϵ+α2ϵαβαϵ

porque . Consequentemente, desde , eventualmente a área do meio é inconseqüente em comparação com a área da esquerda.αβ0α0

O mesmo argumento mostra que, eventualmente, a área do meio está próxima de vezes a área correta, o que também se torna irrelevante. Isto mostra queβ/ϵ

() Não importa o que pode ser, se tomarmos tanto e de ser suficientemente pequeno, então essencialmente toda a área sob está concentrada dentro do intervalo esquerdo e o intervalo certo .0<ϵ<1/2 αβf(0,ϵ)(1ϵ,1)

O resto é fácil: a média estará muito próxima da área próxima ao polo direito (prova: subestime-a substituindo por nas integrais nos intervalos esquerdo e médio e por no intervalo certo, em seguida, superestime-o substituindo por à esquerda, no meio em Ambas as expressões aproximam-se de .) Mas, por as áreas relativas são aproximadamentexf(x)0f(x)(1ϵ)f(x)xf(x)ϵf(x)(1ϵ)f(x)f(x)F(1)F(1ϵ)(3),

F(1)F(1ϵ)F(ϵ)ϵ/βϵ/α=αβ.

Mantendo a média constante, essa relação permanece constante, permitindo adicionar mais uma observação a :()

() Se deixarmos e de tal maneira que aproxime de uma constante limitadora , eventualmente a proporção da área à direita da área na esquerda ficará arbitrariamente perto de também.α0β0α/βλλ

Agora contemple encolhendo para zero. O resultado é que a distribuição limitadora existe e deve ter toda a sua probabilidade concentrada em torno dos valores e : esta é a classe das distribuições de Bernoulli. indica qual: como a distribuição de Bernoulli , cuja média é atribui a probabilidade a e a probabilidade a , a razão deve ser a razão limitanteϵ01()(p)p,p11p0p/(1p)λ.

Na terminologia da pergunta,

λ=α/(1μμα)=μ1μ=p1p,

como reivindicado.

whuber
fonte