Como calcular o intervalo de confiança para uma média geométrica?

8

Desculpas, se isso é confuso, não estou familiarizado com os meios geométricos. Por contexto, meu conjunto de dados é de 35 valores do portfólio no final do mês. Encontrei a taxa de crescimento mês a mês [Mês (N) / Mês (N-1)] - 1, de modo que agora tenho 34 observações e gostaria de estimar o valor final do mês usando o valor conhecido do final do mês anterior. Por exemplo, se eu souber qual foi o valor final do portfólio no mês passado, seria multiplicado por uma taxa de crescimento para obter uma estimativa do valor final deste mês +/- a margem de erro.

Inicialmente, usei a média aritmética das taxas de crescimento, localizei o desvio padrão da amostra e calculei um intervalo de confiança para obter minhas taxas de crescimento do limite inferior / superior.

Agora estou duvidando da precisão desse método e tentei usar a média geométrica. Atualmente, tenho meu conjunto de 34 taxas de crescimento, exceto que não subtraí 1, para que todos os valores sejam positivos, calculemos a média geométrica e, para calcular o desvio padrão, use esta fórmula da wikipedia :

σg=exp(Eu=1 1nem(xEuμg)2n)
Agora estou sem saber como calcular um IC de 95%, já que examinei perguntas semelhantes neste site, além de pesquisar em geral na Internet e estou vendo opiniões diferentes sobre métodos e fórmulas (admito, também estou recebendo um pouco perdido na matemática subjacente).

Atualmente, estou usando as fórmulas para uma distribuição normal para calcular um intervalo de confiança com base no desvio padrão geométrico menos 1 (para retornar a uma porcentagem), de modo que:

  • Erro padrão = [(Geometric Stdev-1) / Sqrt (N)],
  • Margem de erro = [Erro padrão * 1,96] e
  • IC = [Média Geométrica +/- Margem de Erro]

Essa é uma aproximação razoável ou devo usar um método diferente para calcular o IC?

randyvelour
fonte

Respostas:

5

Você pode calcular a média aritmética da taxa de crescimento do log:

  • Deixei Vt ser o valor do seu portfólio no momento t
  • Deixei Rt=VtVt-1 1 seja a taxa de crescimento do seu portfólio de t-1 1 para t

A idéia básica é pegar logs e fazer suas coisas padrão. Tomando logs transforma multiplicação em uma soma.

  • Deixei rt=registroRt seja a taxa de crescimento do log.

r¯=1 1Tt=1 1Trtsr=1 1T-1 1t=1 1T(rt-r¯)2

Então seu erro padrão SEr¯ para a sua amostra média r¯ É dado por:

SEr¯=srT

O intervalo de confiança de 95% para μr=E[rt] seria aproximadamente:

(r¯2SEr¯,r¯+2SEr¯)
.

Exponencial para obter intervalo de confiança para eμr

Desde a ex é uma função estritamente crescente, um intervalo de confiança de 95% para eμr seria:

(er¯-2SEr¯,er¯+2SEr¯)

E nós terminamos. Por que terminamos?

Observar r¯=1 1Ttrt é o log da média geométrica

Conseqüentemente er¯é a média geométrica da sua amostra. Para mostrar isso, observe que a média geométrica é dada por:

GM=(R1 1R2RT)1 1T

Portanto, se tomarmos o log de ambos os lados:

registroGM=1 1Tt=1 1TregistroRt=r¯

Alguns exemplos para criar intuição:

  • Digamos que você calcule a taxa média de crescimento de log é .02. Então a média geométrica éexp(.02)1.0202.
  • Digamos que você calcule a taxa média de crescimento de log é -.05, então a média geométrica é exp(-.05)=.9512

Para x1 1, temos registro(x)x-1 1 e para y0 0, temos exp(y)y+1 1. Mais longe, porém, esses truques se abrem:

  • Digamos que você calcule a taxa média de crescimento de log é .69, a média geométrica média é exp(.69)2 (ou seja, o valor dobra a cada período).

Se todas as suas taxas de crescimento de log rt estão perto de zero (ou equivalentemente VtVt-1 1estiver próximo de 1, você verá que a média geométrica e a média aritmética estarão bem próximas

Outra resposta que pode ser útil:

Como essa resposta discute, as diferenças de log são basicamente alterações percentuais.

Comentário: é útil nas finanças se familiarizar com os registros. É semelhante a pensar em termos de alterações percentuais, mas matematicamente mais limpo.

Matthew Gunn
fonte
Obrigado pela resposta detalhada, qual é a diferença entre este método e o método proposto por @Greenparker? Devo estar obtendo resultados diferentes para desvio padrão, erro, etc?
randyvelour
11
@randyvelour Estamos dizendo algo extremamente semelhante. Minhasr¯ é exatamente o mesmo que o dele Y¯. Ele defende o uso do método delta para obter a distribuição assintótica deeY¯ e use isso para criar um intervalo de confiança Você também pode exponenciar os pontos finais do seu intervalo de confiança para r¯e obtenha um intervalo de confiança assimétrico.
Matthew Gunn
4

Vamos apenas extrair o problema estatístico em questão. Você temX1 1,Xn de alguma distribuição com média μ e variação σ2.

Considerar YEu=registroXEu, onde a média de Y é μy e variação é σy2. Considere a média deYs: Y¯n=Eu=1 1nYEu/n. Então, devido ao CLT,

n(Y¯n-μy)dN(0 0,σy2).

Agora considere eY¯n.

eY¯n=exp{Eu=1 1n1 1nregistroYEu}=exp{Eu=1 1nregistroYEu1 1/n}=Eu=1 1nexp{registroYEu1 1/n}=Eu=1 1nYEu1 1/n.

Portanto, eY¯é a média geométrica! Então, a seguir, podemos aplicar o método Delta ao método CLT. Definirg(x)=ex, então g(x)=ex. Pelo método Delta

n(eY¯n-eμy)dN(0 0,e2μyσy2).

Então agora você tem uma ferramenta para fazer intervalos de confiança. eμy é sua verdadeira média geométrica e você deseja fazer um intervalo de confiança para isso (este não é um intervalo de confiança para o valor esperado μ) O primeiro passo é estimarσy2. Desde aσy2 é a variação do Ys

sy2: =1 1nEu=1 1n(YEu-Y¯n)2=1 1nEu=1 1n(registroXEu-registroeY¯n)2=1 1nEu=1 1nregistro(XEueY¯n).

Para fazer o seu 100(1 1-α)% de intervalo de confiança para a verdadeira média geométrica:

eY¯n±z1 1-α/2eY¯nsyn.
Greenparker
fonte
Obrigado pela resposta detalhada, uma pergunta que tenho é por que a função GEOMEAN no Excel produz um resultado médio geométrico diferente de exp (Ybar)? Estou fazendo algo errado ou é esperada uma diferença? Além disso, a função GEOMEAN parece fornecer (1 + taxa de crescimento), enquanto seu método retorna apenas uma taxa de crescimento. Preciso fazer alguma conversão depois de encontrar a média? Ou, em outras palavras, há pontos em que preciso executar uma operação para voltar a uma taxa de crescimento semelhante ao resultado de (Novo / Antigo)?
Randyvelour