É claro para mim, pela inspeção, que se corrigirmos (assim, fixar a média) e deixar , a distribuição Beta se aproxima de um Bernoulli ( ) distribuição.
Por exemplo:
par(mfrow = c(1, 2),
oma = c(0, 0, 1.5, 0))
xx = seq(0, 1, length.out = 1000)
mus = c(.2, .7)
for (ii in 1:2) {
mu = mus[ii]
matplot(xx, sapply(10^(-1:-5), function(al)
pbeta(xx, al, (1-mu)/mu * al)),
type = 'l', lty = ii,
main = paste('Mean:', mu),
ylab = 'Cumulative Probability', xlab = 'x')
}
title('Beta Approaches Bernoulli', outer = TRUE)
Ou seja, se , seu CDF satisfaz
Onde Bernoulli ( ) e a convergência não são uniformes. Tentei fazer uma prova mais formal disso, mas não consegui fazer nenhum progresso, mesmo em casos simples (como ). A página da Wikipedia na Beta faz referência ao caso várias vezes sem prova. Talvez eu esteja perdendo algo fácil de fazer a integral ou algum fato sobre a função Beta / Beta incompleta. Qualquer ajuda seria apreciada!
convergence
beta-distribution
bernoulli-distribution
MichaelChirico
fonte
fonte
Respostas:
A análise pode ser um pouco confusa, principalmente se realizada com rigor total e elementar, mas a ideia é simples e fácil de entender. Concentre-se em pequenas regiões muito próximas de e . À medida que e aproximam de , quase toda a probabilidade de uma distribuição Beta fica localizada nessas regiões. Ao reduzir os tamanhos das regiões, vemos que a distribuição limitadora, se existir, pode ser apenas uma distribuição de Bernoulli. Podemos criar uma distribuição limitadora apenas tornando a abordagem ratio uma constante, exatamente como descrito na pergunta.0 1 α β 0 (α,β) α:β
O bom dessa análise é que olhar para áreas relativas evita qualquer necessidade de considerar o comportamento da constante de normalização, uma função Beta . Esta é uma simplificação considerável. (Evitar a função Beta é semelhante em espírito à minha análise dos quantis de distribuição Beta em Dois quantis de uma distribuição beta determinam seus parâmetros? )B(α,β)
Um outro recurso dessa análise é aproximar a função Beta incompleta por integrais simples da forma para constantes . Isso reduz tudo às operações mais elementares de cálculo e desigualdades algébricas.∫tcd t c > - 1
O PDF beta é proporcional aConsidere small e examine as contribuições para a área sob dentro dos três intervalos , e como e cresce pequeno (mas permanece positivo).
Eventualmente, e serão menores que : , portanto, terão pólos em e , assim:α β 1 f 0 1
O gráfico de é a linha azul superior. Comparados a ele, estão os gráficos de (curva vermelha, com um polo apenas em ) e (curva de ouro, com um polo apenas em ) .f xα−1 0 (1−x)β−1 1
O que acontece com as três áreas sob , relativas uma à outra, no limite?f
Por uma questão de notação, escreva para a área sob o gráfico de entre e . Estou perguntando sobre os tamanhos relativos de , e .
Vamos estimar essas áreas uma de cada vez, assumindo sempre e e . Sob essas suposições0<α<1 0<β<1, 0<x<1, 0<ϵ<1/2
À esquerda, parece que as curvas azul e vermelha se aproximam. De fato, para , as desigualdades anteriores rendem os limitesA integração de cada um entre e é simples e pressiona entre dois limites próximos,0<x<ϵ
A mesma análise se aplica ao lado direito, produzindo um resultado semelhante.
Como é côncavo, no intervalo do meio ele atinge seus valores extremos nos pontos finais. Consequentemente, a área é menor que a do trapézio medido por esses pontos:f [ϵ,1−ϵ]
Embora isso ameace ficar confuso, vamos corrigir temporariamente e considerar o que acontece com a razão como e aproximam-se de . Nas expressões e , ambos e abordarão . Assim, os únicos termos que importam no limite sãoϵ (F(1−ϵ)−F(ϵ)):F(ϵ) α β 0 (1) (2) (1−ϵ)α−1 (1−ϵ)β−1 (1−ϵ)0=1
porque . Consequentemente, desde , eventualmente a área do meio é inconseqüente em comparação com a área da esquerda.α−β≈0 α→0
O mesmo argumento mostra que, eventualmente, a área do meio está próxima de vezes a área correta, o que também se torna irrelevante. Isto mostra queβ/ϵ
O resto é fácil: a média estará muito próxima da área próxima ao polo direito (prova: subestime-a substituindo por nas integrais nos intervalos esquerdo e médio e por no intervalo certo, em seguida, superestime-o substituindo por à esquerda, no meio em Ambas as expressões aproximam-se de .) Mas, por as áreas relativas são aproximadamentexf(x) 0f(x) (1−ϵ)f(x) xf(x) ϵf(x) (1−ϵ)f(x) f(x) F(1)−F(1−ϵ) (3),
Mantendo a média constante, essa relação permanece constante, permitindo adicionar mais uma observação a :(∗)
Agora contemple encolhendo para zero. O resultado é que a distribuição limitadora existe e deve ter toda a sua probabilidade concentrada em torno dos valores e : esta é a classe das distribuições de Bernoulli. indica qual: como a distribuição de Bernoulli , cuja média é atribui a probabilidade a e a probabilidade a , a razão deve ser a razão limitanteϵ 0 1 (∗∗) (p) p, p 1 1−p 0 p/(1−p) λ.
Na terminologia da pergunta,
como reivindicado.
fonte