Essa pergunta surgiu no trabalho quando alguém me perguntou qual era a relação entre um percentil e um intervalo de confiança, e tive dificuldade em articular meus pensamentos. O contexto era uma pergunta muito simples em relação à estimativa de um intervalo de confiança de 95% na média da amostra.
Entendo que o teorema do limite central afirma que a distribuição amostral da média de qualquer variável aleatória independente será normal ou quase normal, se o tamanho da amostra for grande o suficiente. Portanto, a média da amostra possui uma distribuição normal que é o desvio padrão da amostra.
Agora, digamos que a hipótese nula seja verdadeira. Então, sob a hipótese nula, o intervalo de confiança de 95% em torno da média da amostra é
A pergunta do meu colega de trabalho foi especificamente a seguinte: o erro padrão é apenas o desvio padrão da distribuição amostral da média. Assim, seria equivalente ao percentil 97,5 de uma distribuição criada pelo cálculo da média amostral de muitas amostras de tamanho ?
A pergunta foi realmente estranha para mim, porque percentis e intervalos de confiança são dois conceitos separados e a pergunta do meu colega de trabalho estava perguntando sobre o relacionamento entre os dois, e fiquei muito confusa, mas não consegui articular meus pontos.
Qualquer ajuda seria muito apreciada!
fonte
Respostas:
Seu colega de trabalho está correto, os intervalos de confiança são baseados nos percentis da distribuição amostral da estatística de interesse. Nesse caso, a estatística é . Os percentis de são diferentes.Xμ^=1n∑Xi X
Você pode tentar executar seu experimento de desenhar muitos e calcular seus percentis. Você encontrará uma boa concordância com a fórmula da teoria normal, desde que para cada seja grande o suficiente. E se você continuar pensando sobre isso, poderá acabar reinventando o bootstrap, que usa os percentis observados de para gerar muitos e depois usa os percentis dessa amostra gerada para criar um intervalo de confiança.n μ iX μ iμ^i n μ^i X μ^i
fonte