Eu tenho um tanque bem misturado que contém um número infinito de bolas de gude. Há uma quantidade infinita de bolas de gude no tanque, mas elas só vêm em um número desconhecido, mas finito de variedades : é desconhecido e, para , desenhar um mármore do tipo pode ser mais provável do que desenhar um mármore do tipo .
Em um experimento, uma máquina coleta amostras do tanque usando algum procedimento desconhecido. A máquina reporta um conjunto descrevendo variedades de bolinhas de gude de sua amostra:
As tentativas deste experimento são repetidas ( é corrigido entre as tentativas) e obtemos uma sequência de subconjuntos de , .
As únicas outras coisas que sabemos são:
- ensaios são independentes e idênticos
- a máquina relata as principais variedades mais frequentes em sua amostra
Não sabemos exatamente como a máquina coleta amostras de mármore. Poderia escolher um grande número de bolinhas de gude e relatar o mais frequente. Como alternativa, ele pode continuar pegando bolinhas de gude até que haja q variedades. Há outras coisas que ele também poderia fazer.
A distribuição de nossos testes será afetada pelo procedimento de amostragem da máquina?
fonte
Respostas:
Uma maneira simples de verificar se o método é importante é escolher probabilidades específicas para tipos de bolinhas de gude e calcular a chance de cada subconjunto de acordo com alguns métodos. Isso não pode provar que o método não importa, no entanto.
Suponhamos que existem tipos e as possibilidades de cada tipo são 1 / 2 , 1 / 4 , e 1 / 4 , respectivamente. Suponha que você esteja escolhendo 2 tipos de bolinhas de gude.3 1 / 2 1 / 4 1 / 4 2
Como são diferentes, o método usado pela máquina é importante. Rejeitar pares com tipos repetidos tende a ponderar menos os pares com tipos comuns.
fonte