Qual é a distribuição de probabilidade dessa soma aleatória de variáveis ​​não-iid Bernoulli?

9

Estou tentando encontrar a distribuição de probabilidade de uma soma de um número aleatório de variáveis ​​que não são identicamente distribuídas. Aqui está um exemplo:

John trabalha em um call center de atendimento ao cliente. Ele recebe ligações com problemas e tenta resolvê-las. Os que ele não consegue resolver, ele os encaminha ao seu superior. Vamos supor que o número de chamadas que ele recebe em um dia segue uma distribuição de Poisson com a média . A dificuldade de cada problema varia de coisas bastante simples (com as quais ele pode lidar definitivamente) a perguntas muito especializadas que ele não saberá resolver. Suponha que a probabilidade ele vai ser capaz de resolver o i problema -ésimo segue uma distribuição Beta com os parâmetros e e é independente dos problemas anteriores. Qual é a distribuição do número de chamadas que ele resolve em um dia?p iμpiβαβ

Mais formalmente, tenho:

Y=I(N>0)i=0NXi parai=0,1,2,...,N

onde , e( X i | p i ) ~ B e r n o u l l i ( P i ) p i ~ B e t um ( α , β )NPoisson(μ)(Xi|pi)Bernoulli(pi)piBeta(α,β)

Note-se que, por agora, eu estou feliz em assumir que o s' são independentes. Eu também aceitaria que os parâmetros \ mu, \ alpha e \ beta não se afetam, embora em um exemplo real disso quando \ mu seja grande, os parâmetros \ alpha e \ beta sejam tais que a distribuição Beta tem mais massa com baixas taxas de sucesso p . Mas vamos ignorar isso por enquanto. μ , α β μ α β pXiμ,αβμαβp

Eu posso calcular mas é isso. Também posso simular valores para ter uma ideia de como é a distribuição de (parece Poisson, mas não sei se isso se deve ao número de e que tentei ou se generaliza, e como isso pode mudar para diferentes valores de parâmetro). Alguma idéia do que é essa distribuição ou como eu poderia derivá-la?Y μ , α βP(Y=0)Yμ,αβ

Observe que também postei essa pergunta no Fórum TalkStats, mas achei que poderia receber mais atenção aqui. Desculpas pela postagem cruzada e muito obrigado antecipadamente pelo seu tempo.

EDIT : Como se vê (veja as respostas muito úteis abaixo - e obrigado por elas!), É realmente uma distribuição , algo o que eu estava adivinhando com base na minha intuição e em algumas simulações, mas não consegui provar. O que agora acho surpreendente, porém, é que a distribuição de Poisson depende apenas da média da distribuição mas não é afetada por sua variação.BetaPoisson(μαα+β)Beta

Como exemplo, as duas distribuições Beta a seguir têm a mesma média, mas variação diferente. Para maior clareza, o pdf azul representa um e o vermelho .B e t a ( 0,75 , 0,75 )Beta(2,2)Beta(0.75,0.75)

Distribuições Beta

No entanto, ambos resultariam na mesma distribuição que, para mim, parece um pouco contra-intuitiva. (Não estou dizendo que o resultado está errado, é apenas surpreendente!)Poisson(0.5μ)

Constantinos
fonte
Para fixo, há distribuição binomial de Poisson, mas seu problema é mais complicado que isso. N
Tim
Obrigado, eu sei da distribuição de Poisson-binomial, mas é aleatório aqui. N
Constantinos
Você pode dar uma olhada no Poisson composto , mas pode ser necessário fazer algum trabalho com os 0s para torná-lo útil
Glen_b -Reinstate Monica

Respostas:

6

As chamadas (ou seja, o ) chegam de acordo com um processo de Poisson. O número total de chamadas segue uma distribuição Poisson. Divida as chamadas em dois tipos, por exemplo, se ou . O objectivo é o de determinar o processo que gera os s. Isso é trivial se com uma probabilidade fixa : pelo princípio de superposição dos processos de Poisson, o processo completo reduzido a apenas 1 s também seria um processo de Poisson, com taxa p μ . Na verdade, é esse o caso, apenas precisamos de uma etapa adicional para chegar lá. N X i = 1 X i = 0 1 X i = 1 pXiNXi=1Xi=01Xi=1p1pμ

Marginalize sobre , para que P R ( X i | α , β ) = 1 0 p X i i ( 1 - p i ) 1 - X i p α - 1 i ( 1 - p i ) β - 1pi

Pr(Xi|α,β)=01piXi(1pi)1Xipiα1(1pi)β1B(α,β)dpi=B(Xi+α,1Xi+β)B(α,β)

Onde é a função beta. Usando o fato de que , o acima simplifica para; Γ(x+1)=xΓ(x)B(a,b)=Γ(a)Γ(b)Γ(a+b)Γ(x+1)=xΓ(x)

Pr(XEu=1 1|α,β)=Γ(1 1+α)Γ(β)Γ(1 1+α+β)Γ(α+β)Γ(α)Γ(β)=αα+β
Em outras palavras, . Pela propriedade de superposição, é Poisson distribuído com taxa .YαμXEuBernovocêeueuEu(αα+β)Yαμα+β

Um exemplo numérico (com R) ... na figura, as linhas verticais são da simulação e os pontos vermelhos são o pmf derivado acima:

draw <- function(alpha, beta, mu) 
{ N <- rpois(1, mu); p = rbeta(N, alpha, beta); sum(rbinom(N, size=1, prob=p)) }

pmf <- function(y, alpha, beta, mu)
  dpois(y, alpha*mu/(alpha+beta))

y <- replicate(30000,draw(4,5,10))
tb <- table(y)

# simulated pmf
plot(tb/sum(tb), type="h", xlab="Y", ylab="Probability")
# analytic pmf
points(0:max(y), pmf(0:max(y), 4, 5, 10), col="red")

insira a descrição da imagem aqui

Nate Pope
fonte
3
  1. Como é uma variável aleatória com um você tem e essa é de fato a probabilidade que João realmente resolve o th problema, independentemente de todos os outros. Beta ( α , β ) E [ p i ] = αpEuBeta(α,β) iE[pEu]=αα+βEu

  2. Como o número total de problemas em um dia tem uma distribuição Poisson com o parâmetro e cada um será resolvido com probabilidade , o número que John resolve todos os dias tem uma distribuição Poisson com o parâmetroαμ μααα+βμαα+β

  3. Seu cálculo da probabilidade de ele não resolver nenhum problema deve serP(Y=0 0)=e-μα/(α+β)

Henry
fonte