Inclinação do logaritmo de uma variável aleatória gama

16

Considere a variável aleatória gama . Existem fórmulas puras para média, variação e assimetria:XΓ(α,θ)

E[X]=αθVar[X]=αθ2=1/αE[X]2Skewness[X]=2/α

Considere agora uma variável aleatória transformada em log . A Wikipedia fornece fórmulas para a média e a variação:Y=log(X)

E[Y]=ψ(α)+log(θ)Var[Y]=ψ1(α)

via funções digamma e trigamma, que são definidas como a primeira e a segunda derivadas do logaritmo da função gama.

Qual é a fórmula para a assimetria?

A função tetragamma aparecerá?

(O que me fez pensar sobre isso é uma escolha entre distribuições lognormal e gama, consulte Gamma vs. distribuições lognormal . Entre outras coisas, elas diferem em suas propriedades de assimetria. Em particular, a assimetria do log de lognormal é trivialmente igual a zero. assimetria do log de gama é negativa, mas quão negativa? ..)

ameba diz Restabelecer Monica
fonte
1
Será que isso ajuda? Ou isso ?
S. Kolassa - Restabelece Monica
Não tenho muita certeza do que é a distribuição log-gama. Se está relacionado à gama, como lognormal está relacionado ao normal, então estou perguntando sobre outra coisa (porque "lognormal", confuso, é a distribuição de exp (normal) e não de log (normal)).
Ameba diz Reinstate Monica
1
@Glen_b: Para ser sincero, eu diria que chamar o exponencial do normal de "lognormal" é muito mais inconsistente e confuso. Embora, infelizmente, mais estabelecido.
S. Kolassa - Restabelece Monica
2
@ Stephanie veja também log-logistic, log-Cauchy, log-Laplace, etc. É uma convenção mais claramente estabelecida que o oposto
Glen_b -Reinstate Monica
1
Sim; Tomei cuidado para não dizer "log-gama" em nenhum lugar em relação a essa distribuição por esse motivo. (I utilizaram no passado de uma maneira consistente com o log-normal)
Glen_b -Reinstate Monica

Respostas:

12

A função geradora de momento de é útil neste caso, pois possui uma forma algébrica simples. Pela definição de mgf, temosM(t)Y=lnX

M(t)=E[etlnX]=E[Xt]=1Γ(α)θα0xα+t1ex/θdx=θtΓ(α)0yα+t1eydy=θtΓ(α+t)Γ(α).

Vamos verificar a expectativa e a variação que você deu. Tomando derivadas, temos ePortanto,Segue-seM(t)=Γ(α+t)

M(t)=Γ(α+t)Γ(α)θt+Γ(α+t)Γ(α)θtem(θ)
E[Y]=ψ(0)(α)+ln(θ),
M(t)=Γ(α+t)Γ(α)θt+2Γ(α+t)Γ(α)θtln(θ)+Γ(α+t)Γ(α)θtln2(θ).
Var(Y)=E[Y2]-E[Y]2=Γ"(α)
E[Y]=ψ(0)(α)+ln(θ),E[Y2]=Γ(α)Γ(α)+2ψ(0)(α)ln(θ)+ln2(θ).
Var(Y)=E[Y2]E[Y]2=Γ(α)Γ(α)(Γ(α)Γ(α))2=ψ(1)(α).

Para encontrar a assimetria, observe que a função de geração cumulativa (obrigado @probabilityislogic pela dica) éO primeiro cumulante é, portanto, simplesmente . Lembre-se de que , portanto, os cumulantes subsequentes são , . A assimetria é, portanto,K ( 0 ) = ψ ( 0 ) ( α ) + ln ( θ ) ψ ( n ) ( x ) = d n + 1 ln Γ

K(t)=lnM(t)=tlnθ+lnΓ(α+t)lnΓ(α).
K(0)=ψ(0)(α)+ln(θ) K ( n ) ( 0 ) = ψ ( n - 1 ) ( α ) n 2 E [ ( Y - E [ Y ] ) 3 ]ψ(n)(x)=dn+1lnΓ(x)/dxn+1K(n)(0)=ψ(n1)(α)n2
E[(YE[Y])3]Var(Y)3/2=ψ(2)(α)[ψ(1)(α)]3/2.

Como observação lateral, essa distribuição em particular parece ter sido completamente estudada por AC Olshen em Transformations of the Pearson Type III Distribution , as Distribuições Univariadas Contínuas de Johnson et al. Também têm um pequeno pedaço sobre ela. Confira esses.

Francis
fonte
3
Você deve diferenciar vez de como esta é a função geradora cumulante - mais diretamente relacionada a momentos centrais - onde é a função polygammaK(t)=log[M(t)]=tlog[θ]+log[Γ(α+t)]log[Γ(α)]M(t)skew=K(3)(0)=ψ(2)(α)ψ(n)(z)
probabilityislogic
1
@probabilityislogic: muito bom chamada, mudou a minha resposta
Francis
@probabilityislogic Este é um ótimo complemento, muito obrigado. Eu só quero observar, para que alguns leitores não se confundam, que a distorção não é dada diretamente pelo terceiro cumulante: é o terceiro momento padronizado, não o terceiro momento central. Francis está correto em sua resposta, mas a última fórmula em seu comentário não está correta.
Ameba diz Reinstate Monica
13

I. Cálculo direto

Gradshteyn & Ryzhik [1] (seção 4.358, 7a ed) listam formulários fechados explícitos para para enquanto o caso é feito em 4.352 (supondo que você considere expressões nas funções e como forma fechada) - a partir da qual é definitivamente factível até a curtose; eles fornecem a integral para todos os como derivado de uma função gama; portanto, presumivelmente, é possível subir mais. Portanto, a assimetria é certamente factível, mas não especialmente "pura".

0xν1eμx(lnx)pdx
p=2,3,4p=1Γ,ψζp

Detalhes da derivação das fórmulas em 4.358 estão em [2]. Vou citar as fórmulas fornecidas lá, uma vez que elas são declaradas de maneira um pouco mais sucinta e colocar 4.352.1 na mesma forma.

Seja . Então:δ=ψ(a)lnμ

0xa1eμxlnxdx=Γ(a)μa{δ}0xa1eμxln2xdx=Γ(a)μa{δ2+ζ(2,a)}0xa1eμxln3xdx=Γ(a)μa{δ3+3ζ(2,a)δ2ζ(3,a)}0xa1eμxln4xdx=Γ(a)μa{δ4+6ζ(2,a)δ28ζ(3,a)δ+3ζ2(2,a)+6ζ(4,a))}

onde é a função zw de Hurwitz (a função zie de Riemann é o caso especial )ζ(z,q)=n=0 01(n+q)zq=1

Agora vamos aos momentos do log de uma variável aleatória gama.

Observando, em primeiro lugar, que na escala logarítmica, o parâmetro de escala ou taxa da densidade gama é meramente um parâmetro de deslocamento, portanto, não tem impacto nos momentos centrais; podemos usar o que estiver usando para ser 1.

Se entãoXGama(α,1)

E(registropX)=1Γ(α)0 0registropxxα-1e-xdx.

Podemos definir nas fórmulas integrais acima, o que nos dá momentos brutos; temos , , , .μ=1E(Y)E(Y2)E(Y3)E(Y4)

Como eliminamos do exposto, sem medo de confusão, agora estamos livres para reutilizar para representar o ésimo momento central da maneira usual. Podemos então obter os momentos centrais a partir dos momentos brutos através das fórmulas usuais .μμkk

Então podemos obter a assimetria e curtose como e .μ3μ23/2μ4μ22


Uma nota sobre terminologia

Parece que as páginas de referência da Wolfram escrevem os momentos dessa distribuição (eles chamam de distribuição ExpGamma ) em termos da função poligamma .

Por outro lado, Chan (veja abaixo) chama isso de distribuição log-gama.


II Fórmulas de Chan via MGF

Chan (1993) [3] fornece o mgf como o muito puro .Γ(α+t)/Γ(α)

(Uma boa derivação disso é dada na resposta de Francis, usando o simples fato de que o mgf de é apenas .)registro(X)E(Xt)

Consequentemente, os momentos têm formas bastante simples. Chan dá:

E(Y)=ψ(α)

e os momentos centrais como

E(Y-μY)2=ψ(α)E(Y-μY)3=ψ(α)E(Y-μY)4=ψ(α)

e assim a assimetria é e a curtose é . Presumivelmente, as fórmulas anteriores que tenho acima devem simplificar essas.ψ(α)/(ψ(α)3/2)ψ(α)/(ψ(α)2)

Convenientemente, R oferece as funções digamma ( ) e trigamma ( ), bem como a função poligamma mais geral em que você seleciona a ordem da derivada. (Vários outros programas oferecem funções igualmente convenientes.)ψψ

Conseqüentemente, podemos calcular a assimetria e curtose diretamente no R:

skew.eg <- function(a) psigamma(a,2)/psigamma(a,1)^(3/2)
kurt.eg <- function(a) psigamma(a,3)/psigamma(a,1)^2

Tentando alguns valores de a( acima), reproduzimos as primeiras linhas da tabela no final da Seção 2.2 em Chan [3], exceto que os valores de curtose nessa tabela devem ser excesso de curtose, mas Acabei de calcular a curtose pelas fórmulas dadas acima por Chan; estes devem diferir por 3.α

(Por exemplo, para o log de um exponencial, a tabela diz que o excesso de curtose é 2,4, mas a fórmula para é ... e isso é 2,4. )β2ψ(1)/ψ(1)2

A simulação confirma que, à medida que aumentamos o tamanho da amostra, a curtose de um log de um exponencial está convergindo para cerca de 5,4 e não 2,4. Parece que a tese possivelmente possui um erro.

Consequentemente, as fórmulas de Chan para momentos centrais parecem realmente ser as fórmulas para os cumulantes (veja a derivação na resposta de Francis). Isso significava que a fórmula de assimetria estava correta como está; porque o segundo e o terceiro cumulantes são iguais ao segundo e terceiro momentos centrais.

No entanto, essas são fórmulas particularmente convenientes, desde que tenhamos em mente que kurt.egestá dando excesso de curtose.

Referências

[1] Gradshteyn, IS e Ryzhik IM (2007), Tabela de integrais, séries e produtos, 7ª ed.
Academic Press, Inc.

[2] Victor H. Moll (2007)
As integrais em Gradshteyn e Ryzhik, Parte 4: A função gama
SCIENTIA Série A: Mathematics Sciences, vol. 15, 37–46
Universidade Técnica Federico Santa María, Valparaíso, Chile
http://129.81.170.14/~vhm/FORM-PROOFS_html/final4.pdf

[3] Chan, PS (1993),
um estudo estatístico da distribuição log-gama,
Universidade McMaster (tese de doutorado)
https://macsphere.mcmaster.ca/bitstream/11375/6816/1/fulltext.pdf

Glen_b -Reinstate Monica
fonte
1
Legal. Muito obrigado! De acordo com a entrada da enciclopédia que Stephan vinculou acima, a resposta final para assimetria é (que quase se qualifica como "pura"!). Então parece que todos os zetas assustadores terão que cancelar. ψ(α)/ψ(α)3/2
Ameba diz Reinstate Monica
1
Desculpe, só agora vi seu comentário (estou editando há cerca de uma hora); isso está correto, embora, se a Enciclopédia der a curtose da maneira que Chan faz em sua tese, parece que ela está errada (como foi dada acima), mas prontamente corrigida. As fórmulas limpas parecem ser para cumulantes, e não para momentos centrais padronizados.
Glen_b -Reinstate Monica
Sim, a Enciclopédia fornece a mesma fórmula para a curtose.
Ameba diz Reinstate Monica
γ1γ2
2
ψ(n)(z)=(-1)n+1Γ(n+1)ζ(n+1,z)