Relação entre percentil e intervalo de confiança (média)

9

Essa pergunta surgiu no trabalho quando alguém me perguntou qual era a relação entre um percentil e um intervalo de confiança, e tive dificuldade em articular meus pensamentos. O contexto era uma pergunta muito simples em relação à estimativa de um intervalo de confiança de 95% na média da amostra.

Entendo que o teorema do limite central afirma que a distribuição amostral da média de qualquer variável aleatória independente será normal ou quase normal, se o tamanho da amostra for grande o suficiente. Portanto, a média da amostra possui uma distribuição normal que é o desvio padrão da amostra.N(x¯,s/n)s

Agora, digamos que a hipótese nula seja verdadeira. Então, sob a hipótese nula, o intervalo de confiança de 95% em torno da média da amostra éH0:μx¯=μμx¯±1.96s/n

A pergunta do meu colega de trabalho foi especificamente a seguinte: o erro padrão é apenas o desvio padrão da distribuição amostral da média. Assim, seria equivalente ao percentil 97,5 de uma distribuição criada pelo cálculo da média amostral de muitas amostras de tamanho ?μx¯+1.96s/nn

A pergunta foi realmente estranha para mim, porque percentis e intervalos de confiança são dois conceitos separados e a pergunta do meu colega de trabalho estava perguntando sobre o relacionamento entre os dois, e fiquei muito confusa, mas não consegui articular meus pontos.

Qualquer ajuda seria muito apreciada!

Vincent
fonte
1
Para meu entendimento, para criar o intervalo de confiança de 95% de bootstrap mais simples para uma estatística de interesse (aqui a média), você observa o percentil de 2,5% do vetor de valores de bootstrap (a distribuição da amostra) e o de 97,5%. Portanto, o percentil 2,5% é o limite inferior e o percentil 97,5% é o limite superior do IC 95%.
Valentin

Respostas:

5

Seu colega de trabalho está correto, os intervalos de confiança são baseados nos percentis da distribuição amostral da estatística de interesse. Nesse caso, a estatística é . Os percentis de são diferentes.Xμ^=1nXiX

Você pode tentar executar seu experimento de desenhar muitos e calcular seus percentis. Você encontrará uma boa concordância com a fórmula da teoria normal, desde que para cada seja grande o suficiente. E se você continuar pensando sobre isso, poderá acabar reinventando o bootstrap, que usa os percentis observados de para gerar muitos e depois usa os percentis dessa amostra gerada para criar um intervalo de confiança.n μ iX μ iμ^inμ^iXμ^i

rasta
fonte