Considere uma amostra de números reais. Digamos que queremos estimar a tendência central da população e ter uma noção da nossa incerteza em torno dessa estimativa.
Vamos deixar de lado as suposições sobre a distribuição da população por um momento e considerar as duas abordagens a seguir.
- Obtenha uma amostra de inicialização da amostra de entrada. Ou seja, faça uma amostra com substituição (por exemplo, obtenha 100 reamostragens) e calcule a média de cada reamostragem. Em seguida, produzimos os intervalos de média e confiança na distribuição empírica resultante das médias.
- Produzimos a média da amostra de entrada e percentis em torno da média para transmitir incerteza em torno da estimativa.
Bootstrap vs amostra original:
- Enquanto eu entendo o que a abordagem nº 1 faz. Existe um estimador subjacente por trás do # 2?
- O que os percentis em torno da média do número 2 transmitem em contraste com o IC do número 1? A abordagem nº 2 transmite uma sensação de incerteza, mas estou tendo dificuldade em relacioná-la com uma interpretação freqüentista ou bayesiana.
- O método 2 forneceria um estimador melhor da média da população? (por exemplo, menos tendenciosa e menor variação)?
fonte