Trabalhando com a amostra de bootstrap versus a amostra original

8

Considere uma amostra de números reais. Digamos que queremos estimar a tendência central da população e ter uma noção da nossa incerteza em torno dessa estimativa.

Vamos deixar de lado as suposições sobre a distribuição da população por um momento e considerar as duas abordagens a seguir.

  1. Obtenha uma amostra de inicialização da amostra de entrada. Ou seja, faça uma amostra com substituição (por exemplo, obtenha 100 reamostragens) e calcule a média de cada reamostragem. Em seguida, produzimos os intervalos de média e confiança na distribuição empírica resultante das médias.
  2. Produzimos a média da amostra de entrada e percentis em torno da média para transmitir incerteza em torno da estimativa.

Bootstrap vs amostra original:

  • Enquanto eu entendo o que a abordagem nº 1 faz. Existe um estimador subjacente por trás do # 2?
  • O que os percentis em torno da média do número 2 transmitem em contraste com o IC do número 1? A abordagem nº 2 transmite uma sensação de incerteza, mas estou tendo dificuldade em relacioná-la com uma interpretação freqüentista ou bayesiana.
  • O método 2 forneceria um estimador melhor da média da população? (por exemplo, menos tendenciosa e menor variação)?
Amelio Vazquez-Reina
fonte

Respostas:

5

O estimador em # 2 é o que você está gerando o intervalo para ... a média da amostra. Você está usando o bootstrap para tentar obter a distribuição de amostra da média da amostra, usando a distribuição de reamostragem para aproximar.

Como é o mesmo estimador exatamente nos números 1 e 2, o número 2 terá as mesmas propriedades verdadeiras (sejam elas quais forem, pois você não conhece a verdadeira distribuição, o verdadeiro nível de dependência, etc.) como em # 1, você está apenas tentando acessar uma dessas propriedades de duas maneiras diferentes.

Glen_b -Reinstate Monica
fonte