Como calcular uma média e desvio padrão para uma distribuição lognormal usando 2 percentis

11

Estou tentando calcular uma média e desvio padrão de 2 percentis para uma distribuição lognormal.

Consegui realizar o cálculo de uma distribuição normal usando X = mean + sd * Ze resolvendo para média e sd.

Acho que estou perdendo uma equação quando tento fazer o mesmo para uma distribuição lognormal. Eu olhei para a wikipedia e tentando usar, ln(X) = mean + sd * Zmas estou ficando confuso se a média e o sd nesse caso são para a distribuição normal ou o lognormal.

Quais equações devo usar? e precisarei de mais de 2% para resolver os cálculos?

JF
fonte
Bem-vindo ao site, @ Jean-Francois. Observe que, se você quisesse apenas ajuda de programação R, essa pergunta seria fora de tópico para o CV (consulte nossa página de ajuda ). Eu acho que isso tem conteúdo estatístico suficiente para ser abordado aqui, mas está próximo da fronteira. Pode ser útil formulá-lo de maneira mais neutra em relação ao software e talvez você esteja pronto para respostas que abordem questões estatísticas, mas não são específicas de R.
gung - Restabelece Monica
Eu vou reformular. Eu estava tentando resolver isso com R, mas acho que estou perdendo um conceito fundamental aqui, e é por isso que não estou obtendo os resultados esperados.
JF

Respostas:

12

Parece que você "sabe" ou assume que possui dois quantis; digamos que 42 e 666 são os pontos de 10% e 90% para um lognormal.

A chave é que quase tudo é mais fácil de fazer e entender na escala registrada (normal); exponenciar o mínimo e o mais tarde possível.

Tomo como exemplos quantis que são simetricamente colocados na escala de probabilidade cumulativa. Então, a média na escala logarítmica está a meio caminho entre eles e o desvio padrão (dp) na escala logarítmica pode ser estimado usando a função quantil normal.

Eu usei Mata da Stata para esses cálculos de amostra. A barra invertida \une os elementos em colunas.

mean = mean(ln((42 \ 666)))

(ln(666) - mean) / invnormal(0.9)
1.078232092

SD = (ln(666) - mean) / invnormal(0.9)

A média na escala exponenciada é então

exp(mean + SD^2/2)
299.0981759

e a variação é deixada como um exercício.

(Além disso: deve ser tão fácil ou mais fácil em qualquer outro software decente. invnormal()Está apenas qnorm()em R, se bem me lembro.)

Nick Cox
fonte
Muito obrigado Nick. Muito mais simples quando você volta ao básico. A única alteração que fiz foi na sua última linha exp(mean + SD^2); Eu mudei paraexp(mean + (SD^2)/2)
JF