Número esperado de duplicatas (triplicatas, etc.) ao desenhar com substituição

10

Eu tenho o seguinte problema:

Tenho 100 itens exclusivos (n) e estou selecionando 43 (m) deles um de cada vez (com substituição).

Eu preciso resolver o número esperado de únicos (selecionado apenas uma vez, k = 1), duplos (selecionado exatamente duas vezes k = 2), tripples (exatamente k = 3), quads etc ...

Consegui encontrar muitos resultados sobre a probabilidade de haver pelo menos um duplo (paradoxo do aniversário), mas não sobre o número esperado de pares na população.

Kaitlyn K
fonte
Uma estimativa de Monte Carlo seria útil para você ou precisa da resposta de forma fechada?
David J. Harris
Eu preferiria uma fórmula de formulário fechado para que eu possa aplicá-la facilmente a diferentes valores de n, mek.
precisa

Respostas:

7

O iterm será selecionado vezes. A partir disso, você pode encontrar todas as quantidades desejadas, porque, por exemplo, Por exemplo, o número esperado de pares é dado por ithBinom(m,1/n)

E[number of pairs]=i=1nP[ith item appears twice]
nP[Binom(m,1/n)=2].

Você pode obter o valor numérico em R com o comando n * dbinom (k, m, 1 / n).

Stefan Wager
fonte
Essa fórmula pode ser usada para ak = 0 ou 1?
precisa
Sim pode. Com k = 0, você pode interpretá-lo como `` quantos pontos não aparecerão entre os m selecionados ''.
Stefan Wager
Mas esses eventos não são independentes. Por exemplo, quando o item 1 aparece m vezes, nenhum outro item pode aparecer. Você não pode simplesmente somar os P's.
Asterix314