Considere a variável aleatória gama . Existem fórmulas puras para média, variação e assimetria:
Considere agora uma variável aleatória transformada em log . A Wikipedia fornece fórmulas para a média e a variação:
via funções digamma e trigamma, que são definidas como a primeira e a segunda derivadas do logaritmo da função gama.
Qual é a fórmula para a assimetria?
A função tetragamma aparecerá?
(O que me fez pensar sobre isso é uma escolha entre distribuições lognormal e gama, consulte Gamma vs. distribuições lognormal . Entre outras coisas, elas diferem em suas propriedades de assimetria. Em particular, a assimetria do log de lognormal é trivialmente igual a zero. assimetria do log de gama é negativa, mas quão negativa? ..)
gamma-distribution
skewness
logarithm
ameba diz Restabelecer Monica
fonte
fonte
Respostas:
A função geradora de momento de é útil neste caso, pois possui uma forma algébrica simples. Pela definição de mgf, temosM(t) Y=lnX
Vamos verificar a expectativa e a variação que você deu. Tomando derivadas, temos ePortanto,Segue-seM″(t)=Γ″(α+t)
Para encontrar a assimetria, observe que a função de geração cumulativa (obrigado @probabilityislogic pela dica) éO primeiro cumulante é, portanto, simplesmente . Lembre-se de que , portanto, os cumulantes subsequentes são , . A assimetria é, portanto,K ′ ( 0 ) = ψ ( 0 ) ( α ) + ln ( θ ) ψ ( n ) ( x ) = d n + 1 ln Γ
Como observação lateral, essa distribuição em particular parece ter sido completamente estudada por AC Olshen em Transformations of the Pearson Type III Distribution , as Distribuições Univariadas Contínuas de Johnson et al. Também têm um pequeno pedaço sobre ela. Confira esses.
fonte
I. Cálculo direto
Gradshteyn & Ryzhik [1] (seção 4.358, 7a ed) listam formulários fechados explícitos para para enquanto o caso é feito em 4.352 (supondo que você considere expressões nas funções e como forma fechada) - a partir da qual é definitivamente factível até a curtose; eles fornecem a integral para todos os como derivado de uma função gama; portanto, presumivelmente, é possível subir mais. Portanto, a assimetria é certamente factível, mas não especialmente "pura".
Detalhes da derivação das fórmulas em 4.358 estão em [2]. Vou citar as fórmulas fornecidas lá, uma vez que elas são declaradas de maneira um pouco mais sucinta e colocar 4.352.1 na mesma forma.
Seja . Então:δ=ψ(a)−lnμ
onde é a função zw de Hurwitz (a função zie de Riemann é o caso especial )ζ(z,q)=∑∞n=01( n + q)z q= 1
Agora vamos aos momentos do log de uma variável aleatória gama.
Observando, em primeiro lugar, que na escala logarítmica, o parâmetro de escala ou taxa da densidade gama é meramente um parâmetro de deslocamento, portanto, não tem impacto nos momentos centrais; podemos usar o que estiver usando para ser 1.
Se entãoX∼ Gama ( α , 1 )
Podemos definir nas fórmulas integrais acima, o que nos dá momentos brutos; temos , , , .μ = 1 E( Y) E( Y2) E( Y3) E( Y4)
Como eliminamos do exposto, sem medo de confusão, agora estamos livres para reutilizar para representar o ésimo momento central da maneira usual. Podemos então obter os momentos centrais a partir dos momentos brutos através das fórmulas usuais .μ μk k
Então podemos obter a assimetria e curtose como e .μ3μ3 / 22 μ4μ22
Uma nota sobre terminologia
Parece que as páginas de referência da Wolfram escrevem os momentos dessa distribuição (eles chamam de distribuição ExpGamma ) em termos da função poligamma .
Por outro lado, Chan (veja abaixo) chama isso de distribuição log-gama.
II Fórmulas de Chan via MGF
Chan (1993) [3] fornece o mgf como o muito puro .Γ ( α + t ) / Γ ( α )
(Uma boa derivação disso é dada na resposta de Francis, usando o simples fato de que o mgf de é apenas .)registro( X) E( Xt)
Consequentemente, os momentos têm formas bastante simples. Chan dá:
e os momentos centrais como
e assim a assimetria é e a curtose é . Presumivelmente, as fórmulas anteriores que tenho acima devem simplificar essas.ψ′ ′( α ) / ( ψ′( α )3 / 2) ψ′ ′ ′( α ) / ( ψ′( α )2)
Convenientemente, R oferece as funções digamma ( ) e trigamma ( ), bem como a função poligamma mais geral em que você seleciona a ordem da derivada. (Vários outros programas oferecem funções igualmente convenientes.)ψ ψ′
Conseqüentemente, podemos calcular a assimetria e curtose diretamente no R:
Tentando alguns valores deα
a
( acima), reproduzimos as primeiras linhas da tabela no final da Seção 2.2 em Chan [3], exceto que os valores de curtose nessa tabela devem ser excesso de curtose, mas Acabei de calcular a curtose pelas fórmulas dadas acima por Chan; estes devem diferir por 3.(Por exemplo, para o log de um exponencial, a tabela diz que o excesso de curtose é 2,4, mas a fórmula para é ... e isso é 2,4. )β2 ψ′ ′ ′( 1 ) / ψ′( 1 )2
A simulação confirma que, à medida que aumentamos o tamanho da amostra, a curtose de um log de um exponencial está convergindo para cerca de 5,4 e não 2,4. Parece que a tese possivelmente possui um erro.
Consequentemente, as fórmulas de Chan para momentos centrais parecem realmente ser as fórmulas para os cumulantes (veja a derivação na resposta de Francis). Isso significava que a fórmula de assimetria estava correta como está; porque o segundo e o terceiro cumulantes são iguais ao segundo e terceiro momentos centrais.
No entanto, essas são fórmulas particularmente convenientes, desde que tenhamos em mente que
kurt.eg
está dando excesso de curtose.Referências
[1] Gradshteyn, IS e Ryzhik IM (2007), Tabela de integrais, séries e produtos, 7ª ed.
Academic Press, Inc.
[2] Victor H. Moll (2007)
As integrais em Gradshteyn e Ryzhik, Parte 4: A função gama
SCIENTIA Série A: Mathematics Sciences, vol. 15, 37–46
Universidade Técnica Federico Santa María, Valparaíso, Chile
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf
[3] Chan, PS (1993),
um estudo estatístico da distribuição log-gama,
Universidade McMaster (tese de doutorado)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf
fonte