Ouvi / vi em vários lugares que você pode transformar o conjunto de dados em algo que é distribuído normalmente, pegando o logaritmo de cada amostra, calculando o intervalo de confiança para os dados transformados e transformando o intervalo de confiança novamente usando a operação inversa (por exemplo, eleve 10 à potência dos limites inferior e superior, respectivamente, para o ).
No entanto, desconfio um pouco desse método, simplesmente porque ele não funciona para a média em si:
Qual é a maneira correta de fazer isso? Se não funciona para a média em si, como pode funcionar para o intervalo de confiança da média?
confidence-interval
mean
lognormal
Vegard
fonte
fonte
Respostas:
Existem várias maneiras de calcular intervalos de confiança para a média de uma distribuição lognormal. Vou apresentar dois métodos: Bootstrap e Probabilidade de perfil. Também apresentarei uma discussão sobre os Jeffreys anteriores.
Bootstrap
Para o MLE
Neste caso, a MLE de(μ,σ) para uma amostra (x1,...,xn) são
Em seguida, a MLE da média é δ = exp ( μ + σ 2 / 2 ) . Redefinindo podemos obter uma amostra de bootstrap de δ e, usando este, podemos calcular várias inicialização intervalos de confiança. Os códigos a seguir mostram como obtê-los.δ^= exp( μ^+ σ^2/ 2) δ^
R
Para a amostra média
Agora, considerando o estimadorδ~= x¯ vez do MLE. Outro tipo de estimadores também pode ser considerado.
Probabilidade do perfil
Para a definição de funções de verossimilhança e verossimilhança de perfil, consulte . Usando a propriedade de invariância da probabilidade podemos reparameterise como se segue( μ , σ) → ( δ, σ) , onde δ= exp( μ + σ2/ 2) e, em seguida, calcular a probabilidade numericamente perfil de δ .
Esta função aceita valores em( 0 , 1 ) ; um intervalo de nível 0,147 possui uma confiança aproximada de 95 % . Vamos usar essa propriedade para construir um intervalo de confiança para δ . Os
R
códigos a seguir mostram como obter esse intervalo.R
Observe que eles são muito semelhantes.
fonte
Você pode tentar a abordagem bayesiana com o de Jeffreys. Deveria gerar intervalos de credibilidade com uma propriedade de correspondência frequente correta: o nível de confiança do intervalo de credibilidade é próximo ao seu nível de credibilidade.
fonte
Você está certo - essa é a fórmula para a média geométrica, não a média aritmética. A média aritmética é um parâmetro da distribuição normal e geralmente não é muito significativa para dados lognormal. A média geométrica é o parâmetro correspondente da distribuição lognormal, se você quiser falar mais significativamente sobre uma tendência central para seus dados.
E você realmente calcularia os ICs sobre a média geométrica, tomando os logaritmos dos dados, calculando a média e os ICs como de costume, e transformando-os novamente. Você está certo que realmente não deseja misturar suas distribuições colocando os ICs da média geométrica em torno da média aritmética ... uau!
fonte