Como posso calcular o intervalo de confiança de uma média em uma amostra distribuída normalmente?
Entendo que os métodos de autoinicialização são comumente usados aqui, mas estou aberto a outras opções. Enquanto procuro uma opção não paramétrica, se alguém puder me convencer de que uma solução paramétrica é válida, tudo bem. O tamanho da amostra é> 400.
Se alguém pudesse dar uma amostra em R, seria muito apreciado.
Respostas:
Antes de tudo, eu verificaria se a média é um índice apropriado para a tarefa em questão. Se você estiver procurando por "um valor típico / ou central" de uma distribuição distorcida, a média poderá indicar um valor não representativo. Considere a distribuição log-normal:
A média (linha vermelha) está bem longe da maior parte dos dados. A média aparada de 20% (verde) e a mediana (azul) estão mais próximas do valor "típico".
Os resultados dependem do tipo de sua distribuição "não normal" (um histograma dos seus dados reais seria útil). Se não estiver inclinado, mas tiver caudas pesadas, seus ICs serão muito amplos.
De qualquer forma, acho que o bootstrap é realmente uma boa abordagem, pois também pode fornecer ICs assimétricos. O
R
pacotesimpleboot
é um bom começo:... fornece o seguinte resultado:
fonte
kappa = (exp(1)+2)*sqrt( exp(1) - 1) = 6.184877
s = sqrt( (exp(1)-1)*exp(1) ) = 2.161197
2*s*qnorm(0.975)/sqrt(n) = 0.2678999
kappa*s/(6*n) = 0.00222779
kappa
fonte
Tente uma distribuição normal de log, calculando:
Você terminará com um intervalo de confiança assimétrico em torno do valor esperado (que não é a média dos dados brutos).
fonte