Estimando o número de bolas selecionando sucessivamente uma bola e marcando-a

9

Vamos dizer que tenho N bolas em um saco. No meu primeiro sorteio, marquei a bola e a recoloquei na sacola. No meu segundo sorteio, se eu pegar uma bola marcada, eu a coloco na bolsa. Se, no entanto, eu pegar uma bola não marcada, eu a marca e a devolvo à bolsa. Eu continuo isso para qualquer número de empates. Qual é o número esperado de bolas na bolsa, dado um número de empates e o histórico marcado / não marcado dos empates?

ashemon
fonte
11
Possivelmente relacionado: você analisou o método de captura e recuperação para estimar a abundância da população? en.wikipedia.org/wiki/Mark_and_recapture
a.arfe
"Número esperado" não pode ser entendida no seu sentido técnico usual de um valor esperado, porque não há distribuição de probabilidade para N . Parece que você está pedindo um estimador de N .
whuber

Respostas:

2

Aqui está uma ideia. Deixe ser um subconjunto finito dos números naturais que servirão como os valores possíveis para n . Suponha que temos uma distribuição prévia sobre eu . Fixar um não-aleatória inteiro positivo M . Seja k a variável aleatória que denota o número de vezes que marcamos uma bola em M draws da sacola. O objetivo é encontrar E ( N | k ) . Isso será função de M , ke anterior.EuNEuMkME(N|k)M,k

Pela regra de Bayes, temos

P(N=j|k)=P(k|N=j)P(N=j)P(k)=P(k|N=j)P(N=j)rEuP(k|N=r)P(N=r)

A computação é um cálculo conhecido, que é uma variante do problema dos coletores de cupons. P ( k | N = j ) é a probabilidade de observar k cupons distintos nos sorteios M quando houver j cupons no total. Veja aqui um argumento paraP(k|N=j)P(k|N=j)kMj

P(k|N=j)=(jk)k!S(M,k)jM

onde denota um número stirling do segundo tipo . Podemos então calcularS

E(N|k)=jEujP(N=j|k)

Abaixo estão alguns cálculos para vários e . Em cada caso, usamos um uniforme anterior emM [ k , 10 k ]kM[k,10k]

MkE(N)1057,991555,60151023,69301520,00302039,53
user35546
fonte