Eu tenho 383 amostras que têm um viés pesado para alguns valores comuns, como eu calcularia o IC95% para a média? O IC que calculei parece muito distante, o que suponho é que meus dados não parecem uma curva quando eu faço um histograma. Então, acho que preciso usar algo como bootstrapping, que não entendo muito bem.
confidence-interval
mean
IhaveCandy
fonte
fonte
Respostas:
Sim, o bootstrap é uma alternativa para obter intervalos de confiança para a média (e você deve fazer um pouco de esforço se quiser entender o método).
A ideia é a seguinte:
Em relação à última etapa, existem vários tipos de intervalo de confiança de autoinicialização (BCI). As referências a seguir apresentam uma discussão sobre as propriedades de diferentes tipos de BCI:
http://staff.ustc.edu.cn/~zwp/teach/Stat-Comp/Efron_Bootstrap_CIs.pdf
http://www.tau.ac.il/~saharon/Boot/10.1.1.133.8405.pdf
É uma boa prática calcular vários BCI e tentar entender possíveis discrepâncias entre eles.
No R, você pode implementar facilmente essa ideia usando o pacote R 'boot' da seguinte maneira:
fonte
Outra alternativa padrão é calcular o IC com o teste de Wilcoxon. Em R
Infelizmente, ele fornece o IC em torno da (pseudo) mediana, não a média, mas se os dados estiverem muito fora do normal, talvez a mediana seja uma medida mais informativa.
fonte
Para dados log-normais, Olsson (2005) sugere um 'método de Cox modificado'
Uma função R está abaixo:
Repetindo o exemplo do artigo de Olsson
fonte
fonte