Imagine que você deseja avaliar a compressibilidade de um documento grande muito rapidamente. Você pode escolher aleatoriamente uma subsequência, tentar compactá-la. Isso pode servir como uma previsão para a compressibilidade geral do documento. Mas qual deve ser o tamanho da sua amostra?
Criamos a seguinte estratégia:
- Escolha um tamanho de amostra arbitrário (pequeno). Meça a compressibilidade.
- Em seguida, dobre o tamanho da amostra e meça a compressibilidade novamente. Se houver pouca alteração (digamos menos de 10%), conclua que você determinou com segurança a compressibilidade do documento. Caso contrário, duplique o tamanho da amostra novamente e assim por diante.
Temos certeza de que essa não é uma estratégia nova e estamos nos perguntando se ela está relacionada a alguma estratégia bem conhecida usada pelos estatísticos.
("Compactação" é apenas um exemplo. Basicamente, estamos interessados em uma métrica que não possui boas propriedades matemáticas conhecidas, para que não seja possível determinar analiticamente o que poderia ser um bom tamanho de amostra. Não temos escolha a não ser cair de volta a essas heurísticas.)
fonte