Recentemente, achei necessário derivar um pdf para o quadrado de uma variável aleatória normal com média 0. Por qualquer motivo, optei por não normalizar a variação anteriormente. Se eu fiz isso corretamente, este pdf é o seguinte:
Percebi que isso era de fato apenas uma parametrização de uma distribuição gama:
E então, pelo fato de a soma de duas gama (com o mesmo parâmetro de escala) ser igual a outra gama, segue-se que a gama é equivalente à soma das variáveis aleatórias normais ao quadrado.
Isso foi um pouco surpreendente para mim. Embora eu soubesse que a distribuição do - uma distribuição da soma dos RV normais normais ao quadrado - era um caso especial da gama, eu não sabia que a gama era essencialmente apenas uma generalização que permitia a soma de variáveis aleatórias normais de qualquer variação. Isso também leva a outras caracterizações que eu nunca havia encontrado antes, como a distribuição exponencial equivalente à soma de duas distribuições normais ao quadrado.
Tudo isso é um tanto misterioso para mim. A distribuição normal é fundamental para a derivação da distribuição gama, da maneira descrita acima? A maioria dos recursos que verifiquei não menciona que as duas distribuições estão intrinsecamente relacionadas dessa maneira, ou mesmo descrevem como a gama é derivada. Isso me faz pensar que alguma verdade de nível inferior está em jogo que eu simplesmente destaquei de uma maneira complicada?
Respostas:
Como observou o comentário do Prof. Sarwate, as relações entre o quadrado normal e o qui-quadrado são um fato amplamente disseminado - como também deve ser o fato de que um qui-quadrado é apenas um caso especial da distribuição Gamma:
a última igualdade após a propriedade de escala do Gamma.
No que diz respeito à relação com o exponencial, para ser preciso, é a soma de dois normais médios zero quadráticos, cada um escalado pela variação do outro , que leva à distribuição exponencial:
Mas a suspeita de que existe "algo especial" ou "mais profundo" na soma de dois valores médios médios de zero ao quadrado que "os tornam um bom modelo para o tempo de espera" é infundada: Antes de tudo, o que há de especial na distribuição exponencial que faz é um bom modelo para "tempo de espera"? Sem memória, é claro, mas há algo "mais profundo" aqui, ou apenas a forma funcional simples da função de distribuição Exponencial e as propriedades de ? Propriedades únicas estão espalhadas por toda a Matemática e, na maioria das vezes, elas não refletem alguma "intuição mais profunda" ou "estrutura" - elas simplesmente existem (felizmente).e
Segundo, o quadrado de uma variável tem muito pouca relação com seu nível. Apenas considere em, digamos, [ - 2 ,f(x)=x :[−2,2]
... ou representa graficamente a densidade normal padrão em relação à densidade do qui-quadrado: eles refletem e representam comportamentos estocásticos totalmente diferentes, mesmo estando intimamente relacionados, pois o segundo é a densidade de uma variável que é o quadrado do primeiro. O normal pode ser um pilar muito importante do sistema matemático que desenvolvemos para modelar o comportamento estocástico - mas, quando você o ajusta, torna-se algo totalmente diferente.
fonte
Vamos abordar a questão colocada, tudo isso é um tanto misterioso para mim. A distribuição normal é fundamental para a derivação da distribuição gama ...? Na verdade, nenhum mistério é simplesmente que a distribuição normal e a distribuição gama são membros, entre outros da família exponencial de distribuições, cuja família é definida pela capacidade de converter entre formas equacionais por substituição de parâmetros e / ou variáveis. Como conseqüência, há muitas conversões por substituição entre distribuições, algumas das quais estão resumidas na figura abaixo.
LEEMIS, Lawrence M .; Jacquelyn T. MCQUESTON (fevereiro de 2008). "Relacionamentos de distribuição univariados" (PDF). Estatístico americano. 62 (1): 45-53. doi: 10.1198 / 000313008x270448 citar
Aqui estão duas relações de distribuição normal e gama com mais detalhes (entre um número desconhecido de outras, como via qui-quadrado e beta).
Primeiro Segue-se uma relação mais direta entre a distribuição gama (GD) e a distribuição normal (ND) com zero médio. Simplificando, o GD se torna normal na forma, pois seu parâmetro de forma pode aumentar. Provar que é esse o caso é mais difícil. Para o GD,
Graphically fork=2 and a=1,2,4,8,16,32,64 the GD is in blue and the limiting ND(x;0, 22) is in orange, below
Second Let us make the point that due to the similarity of form between these distributions, one can pretty much develop relationships between the gamma and normal distributions by pulling them out of thin air. To wit, we next develop an "unfolded" gamma distribution generalization of a normal distribution.
Note first that it is the semi-infinite support of the gamma distribution that impedes a more direct relationship with the normal distribution. However, that impediment can be removed when considering the half-normal distribution, which also has a semi-infinite support. Thus, one can generalize the normal distribution (ND) by first folding it to be half-normal (HND), relating that to the generalized gamma distribution (GD), then for our tour de force, we "unfold" both (HND and GD) to make a generalized ND (a GND), thusly.
The generalized gamma distribution
Can be reparameterized to be the half-normal distribution,
Note thatθ=π√σ2√. Thus,
which implies that
is a generalization of the normal distribution, whereμ is the location, α>0 is the scale, and β>0 is the shape and where β=2 yields a normal distribution. It includes the Laplace distribution when β=1 . As β→∞ , the density converges pointwise to a uniform density on (μ−α,μ+α) . Below is the generalized normal distribution plotted for α=π√2,β=1/2,1,4 in blue with the normal case α=π√2,β=2 in orange.
The above can be seen as the generalized normal distribution Version 1 and in different parameterizations is known as the exponential power distribution, and the generalized error distribution, which are in turn one of several other generalized normal distributions.
fonte
The derivation of the chi-squared distribution from the normal distribution is much analogous to the derivation of the gamma distribution from the exponential distribution.
We should be able to generalize this:
The analogy is as following:
Normal and Chi-squared distributions relate to the sum of squares
The joint density distribution of multiple independent standard normal distributed variables depends on∑x2i
f(x1,x2,...,xn)=exp(−0.5∑ni=1xi2)(2π)n/2
IfXi∼N(0,1)
then∑ni=1Xi2∼χ2(ν)
Exponential and gamma distributions relate to the regular sum
The joint density distribution of multiple independent exponential distributed variables depends on∑xi
IfXi∼Exp(λ)
then∑ni=1Xi∼Gamma(n,λ)
The derivation can be done by a change of variables integrating not over allx1,x2,...xn but instead only over the summed term (this is what Pearson did in 1900). This unfolds very similar in both cases.
For theχ2 distribution:
WhereV(s)=πn/2Γ(n/2+1)sn/2 is the n-dimensional volume of an n-ball with squared radius s .
For the gamma distribution:
WhereV(s)=snn! is the n-dimensional volume of a n-polytope with ∑xi<s .
The gamma distribution can be seen as the waiting timeY for the n -th event in a Poisson process which is the distributed as the sum of n exponentially distributed variables.
As Alecos Papadopoulos already noted there is no deeper connection that makes sums of squared normal variables 'a good model for waiting time'. The gamma distribution is the distribution for a sum of generalized normal distributed variables. That is how the two come together.
But the type of sum and type of variables may be different. While the gamma distribution, when derived from the exponential distribution (p=1), gets the interpretation of the exponential distribution (waiting time), you can not go reverse and go back to a sum of squared Gaussian variables and use that same interpretation.
The density distribution for waiting time which falls of exponentially, and the density distribution for a Gaussian error falls of exponentially (with a square). That is another way to see the two connected.
fonte