Só quero verificar algum raciocínio.
Se minha amostra original é do tamanho e eu a inicializo, meu processo de pensamento é o seguinte:
n-1 é a chance de qualquer observação extraída da amostra original. Para garantir que o próximo sorteio não seja a observação amostrada anteriormente, restringimos o tamanho da amostra para . Assim, obtemos este padrão:
Isso está correto? Eu tropeço no motivo pelo qual não pode ser .
sampling
bootstrap
sample-size
subsampling
Jayant.M
fonte
fonte
Respostas:
Observe que, em cada posição de observação ( ), podemos escolher qualquer uma das observações; portanto, existem possíveis novas amostras (mantendo a ordem em que são desenhadas) das quaissão a "mesma amostra" (ou seja, contêm todas as observações originais sem repetições; isso explica todas as maneiras de solicitar a amostra com a qual começamos).n n n n ! ni=1,2,...,n n nn n! n
Por exemplo, com três observações, a, bec, você tem 27 amostras possíveis:
Seis deles contêm um de a, bec.
Portanto, é a probabilidade de recuperar a amostra original.n!/nn
Além - uma rápida aproximação da probabilidade:
Considere o seguinte :
tão
Com o limite inferior sendo o usual dado para a aproximação de Stirling (que possui um erro relativo baixo para grande ).n
[Gosper sugeriu o uso de que produziria a aproximação para esta probabilidade , que funciona razoavelmente bem até ou até dependendo de quão rigorosos são seus critérios.]n!≈(2n+13)π−−−−−−−−−√nne−n (2n+13)π−−−−−−−−√e−n n=3 n=1
(Resposta ao comentário :) A probabilidade de não obter uma observação específica em uma determinada amostra é que para grande é aproximadamente .nE-1(1−1n)n n e−1
Para obter detalhes, consulte
Por que, em média, cada amostra de inicialização contém aproximadamente dois terços das observações?
fonte