Paradoxo do processo de Poisson com pelo menos um evento no intervalo

7

Deixe é um número de eventos no processo de Poisson de taxa unitária ( ) dentro de intervalo de comprimento . Sabe-se que pelo menos um evento foi observado no intervalo, quero encontrar probabilidade de que haja mais eventos no intervalo.XTλ=1T

Minha intuição é que .Pr(XT>1XT>0)=Pr(XT>0)

A lógica por trás disso é que

  1. se o evento observado estava no tempo t desde o início do intervalo, é suficiente calcular a probabilidade de que nenhum evento ocorreu nos intervalos abertos (0,t) ou (t,T) : Pr(XT=1XT>0)=Pr(Xt=0)Pr(XTt=0)=etetT=eT=Pr(XT=0) ,

  2. Pr(XT>1XT>0)=1Pr(XT=1XT>0)Pr(XT>0)=1Pr(XT=0).

Contudo

Pr(XT>1XT>0)=Pr(XT>1,XT>0)Pr(XT>0)=Pr(XT>1)Pr(XT>0)=1Pr(XT{1,0})1Pr(XT=0)=1TeTeT1eT,

que nem eu nem WolframAlpha podem ser iguais a Pr(XT>0)=1eT .

Como os dois resultados não podem ser verdadeiros - onde está meu erro?

Eu posso ver que XT>1 e XT>0 são fortemente dependentes. Isso importa? Minha intuição é que XT>0 está apenas estreitando o espaço de amostragem ...

[EDIT # 1]

Eu encontrei mais uma maneira de apoiar ... ambos os resultados.

Se é a hora do primeiro evento no intervalo (desde o início do intervalo), sua densidade de distribuição será dada comoEntãotpdf(t)=et1eT.

Pr(XT=1XT>0)=0Tpdf(t)Pr(XTt=0)dt=0TetetT1eTdt=TeT1eT.

No entanto, se eu repetir os passos semelhantes para uniformemente distribuída ( ) evento aleatório no intervalo e ter em conta também eventos antes de eu ainda recebo pdf(t)=1Tt

Pr(XT=1XT>0)=0Tpdf(t)Pr(Xt=0)Pr(XTt=0)dt=0TeTTdt=eT.

[EDIT # 2]

Acompanhamento devido ao comentário de @combo (sobre perda de condicionamento na primeira abordagem).

Eu não entendo, por que o condicionamento está perdido.

Imagine uma situação em que criamos um intervalo de comprimento com pelo menos um evento de processo unitário de Poisson. Deixe que é um acontecimento aleatório de Poisson processo unitário e é uma variável aleatória uniformemente distribuída em . Então é um intervalo de comprimento contendo pelo menos um evento, em (uniformemente distribuído) desde o início do intervalo. Da independência dos eventos, a probabilidade de que não haja mais eventos no intervalo é , não é? E é dado que houve pelo menos um evento no intervalo.TYt(0, T)(Y  t, Y  t + T)TtPr(Xt==0)Pr(XTt==0)

Por que a situação é diferente quando tenho um intervalo de duração que contém pelo menos um evento? O tempo de um evento escolhido aleatoriamente ( ; desde o início do intervalo) é distribuído uniformemente, portanto não vejo diferença.Tt

abukaj
fonte
Por que você afirma que ? Não vejo por que esse deveria ser o caso, e essa é a fonte dos seus problemas. Quando resolvo isso sozinho, recebo a mesma resposta que sua abordagem nº 2. P(XT=1XT>0)=P(Xt=0)P(XTt=0)
combo
@StefanJorgensen Entendo o seu ponto. No entanto, não deveria ser ? P(Xt=1)P(XTt=0)=tete(Tt)=teT
abukaj
@StefanJorgensen, respondendo ao seu segundo comentário: é porque eu considerei o evento um ponto de partição do intervalo em duas subintervalos de número desconhecido de eventos.
abukaj
@StefanJorgensen é como responder a uma pergunta: dado que houve um evento no tempo , qual é a probabilidade de que não houvesse evento em ou . t(0,t)(t,T)
22717 abukaj
Exceto que a equação é simplesmente a probabilidade de que não haja evento em ou e não expresse seu condicionamento. . É por isso que sua resposta acaba sendo simplesmente a probabilidade de que haja pelo menos um evento (porque o condicionamento foi perdido no início), quando, na verdade, o condicionamento altera o resultado. P(Xt=0)P(XTt=0)(0,t)(t,T)
combo

Respostas:

2

Eu finalmente descobri!

De acordo com o conselho do @ combo, vou usar o termo "ocorrência".

Surpreendentemente, a primeira parte da lógica da minha intuição estava quase correta.

Se a ocorrência observada ocorreu no tempo desde o início do intervalo, é suficiente calcular a probabilidade de que nenhuma ocorrência ocorreu em intervalos abertos ou : .t(0,t)(t,T)Pr(XT=1t)=Pr(Xt=0)Pr(XTt=0)=etetT=eT=Pr(XT=0)

A diferença é a substituição de por , que pode ser vista como , onde é um comprimento de infinito; pequeno intervalo . Como , podemos ver como uma densidade no ponto do único ocorrência dentro do intervalo .Pr(XT=1XT>0)Pr(XT=1t)Pr(XT=1Xdt=1)dt[tdt2,t+dt2]Pr(XT=1,t)=eTdtpdf(t)=Pr(XT=1t)t(0,T)

Como o valor de é desconhecido, integramos . Até aí tudo bem - sabemos a probabilidade incondicional de ter exatamente uma ocorrência no intervalo. No entanto, condicionando em a fração do espaço amostral foi descartada - portanto, é necessário normalizar todas as probabilidades / densidades restantes por um fator de .t0Tpdf(t)dt=TeT=Pr(XT=1)XT>0eT11eT

Assim, a intuição foi a falácia de confundir probabilidade com densidade.

abukaj
fonte
1

Uma observação rápida sobre a terminologia para evitar confusões: vou me referir a algo que acontece em um determinado momento como uma "ocorrência" em vez de um "evento", a fim de evitar confusão com a definição mais rigorosa de um evento como um elemento da amostra espaço.

Vamos começar pela definição do processo de contagem de Poisson. Deixe- é o número de ocorrências que acontecem por tempo . Possui as seguintes propriedades:N(t)T

  1. N(0)=0
  2. N(T1),(N(T2)N(T1)) são independentes para (propriedade de incrementos independentes)T1<T2
  3. O número de ocorrências em qualquer intervalo de comprimento é uma variável aleatória Poisson com o parâmetro (para nossos propósitos, ).tλtλ=1

A propriedade de incrementos independentes é o que está atrapalhando você - especificamente as implicações da estrita desigualdade.

Estamos fazendo a pergunta, dado que uma ocorrência acontece no tempo , qual é a probabilidade de ? Seguindo sua abordagem, vamos dividir o processo em três segmentos. Para alguns , temos: e agora estamos analisando a probabilidade t[0,T]N(T)=1ϵ<min{t,Tt}

N(T)=(N(T)N(t+ϵ))+(N(t+ϵ)N(tϵ))+(N(tϵ)N(0))
limϵ0P(N(T)=1N(t+ϵ)N(tϵ)=1)=limϵ0P(N(tϵ)N(0)=0,N(T)N(t+ϵ)=0N(t+ϵ)N(tϵ)=1)
Observe que isso não é exatamente o que você escreveu. Existem duas diferenças principais:
  1. Os intervalos não são disjuntos, portanto, enquanto é independente de , nem são independentes de .N(tϵ)N(0)N(T)N(t+ϵ)N(t+ϵ)N(tϵ)
  2. Todos os intervalos têm medida positiva. Em sua abordagem, você divide o intervalo em três partes, O problema é que agora você está condicionando o evento em que uma ocorrência acontece no intervalo , que mede zero (para obter mais detalhes sobre por que isso é um problema, consulte este post ).[0,T][0,t),[t],(t,T][t]
combinação
fonte
1. Estou um pouco confuso sobre e no último parágrafo. Você quer dizer que há uma sobreposição de intervalo do tamanho ? 2. Pode ser um efeito da confusão, mas não vejo a diferença entre e dado que a ocorrência em é dada: . ϵsϵslims0P(N(ts)N(0)=0,N(T)N(t+s)=0N(t+s)N(ts)=1)lims0P(N(ts)N(0)=0,N(T)N(t+s)=0)tP(N(t+s)N(ts)=1)=1
21717 abukaj
Desculpe por isso, eu queria que eles fossem iguais, mas meu computador morreu durante a edição. A diferença é precisamente a fonte da sua confusão: o evento não é independente do evento para . Se você tentar criar (com igualdade, não com limite), o intervalo será um singleton e você estará condicionando um conjunto com a medida zero. {N(tϵ)N(0)=0,N(T)N(t+ϵ)=0}{N(t+ϵ)N(tϵ)=1}ϵ>0ϵ=0
combo
11
Bem, eu não vejo a dependência. No entanto, consegui encontrar a falácia (veja minha resposta) - e como o intervalo era importante, portanto +1. [tϵ,t+ϵ]
abukaj
0

De suas duas maneiras de abordar o problema, a segunda parece estar correta. É muito mais rigoroso e faz total sentido para mim. No entanto, tive um pouco mais de dificuldade em entender a primeira abordagem, o que deu motivos para acreditar que essa é a fonte do seu erro.

Primeiramente, por curiosidade, por que você está calculando ? Dada a mesma abordagem usada abaixo, essa probabilidade (na medida em que for relevante) deve ser igual a que por definição não é igual a . Espero que isto ajude!P(XT=1|XT>0)TeT1eTeT

Felix van Doorn
fonte
Ainda não consigo ver meu erro na primeira abordagem. Estou calculando isso desde que - veja a edição. P(XT>1|XT>0)=1P(XT=1|XT>0)
abukaj