Por que a embalagem usa amostras de bootstrap?

10

Ensacamento é o processo de criação de N alunos em N amostras de bootstrap diferentes e, em seguida, calcula a média de suas previsões.

Minha pergunta é: por que não usar outro tipo de amostragem? Por que usar amostras de bootstrap?


fonte

Respostas:

9

Pergunta interessante. O bootstrap tem boas propriedades de amostragem, em comparação com algumas alternativas como o canivete. A principal desvantagem do bootstrap é que toda iteração precisa trabalhar com uma amostra do tamanho do conjunto de dados original (que pode ser caro em termos de computação), enquanto outras técnicas de amostragem podem funcionar com amostras muito menores.

Este artigo sugere que o corte ingenuamente do tamanho da amostra pode reduzir o desempenho, em relação ao ensacamento baseado em bootstrap, o que seria um motivo para não fazer isso. O artigo também apresenta um novo método para usar amostras menores nas estimativas de ensacamento, evitando esses problemas.

David J. Harris
fonte