Estou tentando encontrar a distribuição de probabilidade de uma soma de um número aleatório de variáveis que não são identicamente distribuídas. Aqui está um exemplo:
John trabalha em um call center de atendimento ao cliente. Ele recebe ligações com problemas e tenta resolvê-las. Os que ele não consegue resolver, ele os encaminha ao seu superior. Vamos supor que o número de chamadas que ele recebe em um dia segue uma distribuição de Poisson com a média . A dificuldade de cada problema varia de coisas bastante simples (com as quais ele pode lidar definitivamente) a perguntas muito especializadas que ele não saberá resolver. Suponha que a probabilidade ele vai ser capaz de resolver o i problema -ésimo segue uma distribuição Beta com os parâmetros e e é independente dos problemas anteriores. Qual é a distribuição do número de chamadas que ele resolve em um dia?p iβ
Mais formalmente, tenho:
para
onde , e( X i | p i ) ~ B e r n o u l l i ( P i ) p i ~ B e t um ( α , β )
Note-se que, por agora, eu estou feliz em assumir que o s' são independentes. Eu também aceitaria que os parâmetros \ mu, \ alpha e \ beta não se afetam, embora em um exemplo real disso quando \ mu seja grande, os parâmetros \ alpha e \ beta sejam tais que a distribuição Beta tem mais massa com baixas taxas de sucesso p . Mas vamos ignorar isso por enquanto. μ , α β μ α β p
Eu posso calcular mas é isso. Também posso simular valores para ter uma ideia de como é a distribuição de (parece Poisson, mas não sei se isso se deve ao número de e que tentei ou se generaliza, e como isso pode mudar para diferentes valores de parâmetro). Alguma idéia do que é essa distribuição ou como eu poderia derivá-la?Y μ , α β
Observe que também postei essa pergunta no Fórum TalkStats, mas achei que poderia receber mais atenção aqui. Desculpas pela postagem cruzada e muito obrigado antecipadamente pelo seu tempo.
EDIT : Como se vê (veja as respostas muito úteis abaixo - e obrigado por elas!), É realmente uma distribuição , algo o que eu estava adivinhando com base na minha intuição e em algumas simulações, mas não consegui provar. O que agora acho surpreendente, porém, é que a distribuição de Poisson depende apenas da média da distribuição mas não é afetada por sua variação.Beta
Como exemplo, as duas distribuições Beta a seguir têm a mesma média, mas variação diferente. Para maior clareza, o pdf azul representa um e o vermelho .B e t a ( 0,75 , 0,75 )
No entanto, ambos resultariam na mesma distribuição que, para mim, parece um pouco contra-intuitiva. (Não estou dizendo que o resultado está errado, é apenas surpreendente!)
fonte
Respostas:
As chamadas (ou seja, o ) chegam de acordo com um processo de Poisson. O número total de chamadas segue uma distribuição Poisson. Divida as chamadas em dois tipos, por exemplo, se ou . O objectivo é o de determinar o processo que gera os s. Isso é trivial se com uma probabilidade fixa : pelo princípio de superposição dos processos de Poisson, o processo completo reduzido a apenas 1 s também seria um processo de Poisson, com taxa p μ . Na verdade, é esse o caso, apenas precisamos de uma etapa adicional para chegar lá. N X i = 1 X i = 0 1 X i = 1 pXEu N XEu= 1 XEu= 0 1 1 XEu= 1 p 1 1 p μ
Marginalize sobre , para que P R ( X i | α , β ) = ∫ 1 0 p X i i ( 1 - p i ) 1 - X i p α - 1 i ( 1 - p i ) β - 1pEu
Onde é a função beta. Usando o fato de que , o acima simplifica para; Γ(x+1)=xΓ(x)B( a , b ) = Γ ( a ) Γ ( b )Γ ( a + b ) Γ ( x + 1 ) = x Γ ( x )
Um exemplo numérico (com R) ... na figura, as linhas verticais são da simulação e os pontos vermelhos são o pmf derivado acima:
fonte
Como é uma variável aleatória com um você tem e essa é de fato a probabilidade que João realmente resolve o th problema, independentemente de todos os outros. Beta ( α , β ) E [ p i ] = αpEu Beta( α , β) iE [ pEu] = αα + β Eu
Como o número total de problemas em um dia tem uma distribuição Poisson com o parâmetro e cada um será resolvido com probabilidade , o número que John resolve todos os dias tem uma distribuição Poisson com o parâmetroαμ μααα + β μ αα + β
Seu cálculo da probabilidade de ele não resolver nenhum problema deve serP (Y= 0 ) = e- μ α / ( α + β)
fonte