Quando preferir a função geradora de momento à função característica?

9

Seja um espaço de probabilidade e deixe seja um vetor aleatório. Seja a distribuição de , uma medida Borel em .(Ω,F,P)X:ΩRnPX=XPXRn

  • A função característica de é a função definida para (a variável aleatória é limitada, portanto, em para todos os ). Esta é a transformação de Fourier de .X
    φX(t)=E[eEutX]=ΩeEutXdP,
    tRneEutXeu1(P)tPX
  • A função geradora de momento ( mgf ) de é a função definida para todos os para o qual a integral acima existe . Essa é a transformação de Laplace de .X
    MX(t)=E[etX]=ΩetXdP,
    tRn PX

Já podemos ver que a função característica é definida em todos os lugares em , mas o mgf possui um domínio que depende de e esse domínio pode ser apenas (isso acontece, por exemplo, para uma variável aleatória distribuída por Cauchy).RnX{0 0}

Apesar disso, funções características e mgf's compartilham muitas propriedades, por exemplo:

  1. Se são independentes, então para todos os , e M_ { X_1 + \ cdots + X_n} (t) = M_ {X_1} (t) \ cdots M_ {X_n} (t) para todos os t para os quais existem mgf .X1,,Xn
    φX1++Xn(t)=φX1(t)φXn(t)
    t
    MX1++Xn(t)=MX1(t)MXn(t)
    t
  2. Dois vetores aleatórios e têm a mesma distribuição se e somente se para todos os . O mgf analógico desse resultado é que, se para todos os em alguma vizinhança de , e têm a mesma distribuição.XYφX(t)=φY(t)tMX(t)=MY(t)t 0 X Y0 0XY
  3. Funções características e mgfs de distribuições comuns geralmente têm formas semelhantes. Por exemplo, se ( dimensional normal com média e matriz de covariância ), então e XNn(μ,Σ)nμΣ
    φX(t)=exp(Euμt-12t(Σt))
    MX(t)=exp(μt-12t(Σt)).
  4. Quando algumas suposições suaves são válidas, tanto a função característica quanto a mgf podem ser diferenciadas para calcular os momentos.
  5. O teorema da continuidade de Lévy fornece um critério para determinar quando uma sequência de variáveis ​​aleatórias converge na distribuição para outra variável aleatória usando a convergência das funções características correspondentes. Existe um teorema correspondente para mgf ( Curtiss 1942, Teorema 3 ).

Dado que funções características e mgf's são freqüentemente usadas para o mesmo propósito e o fato de que uma função característica sempre existe enquanto que mgf nem sempre existe, parece-me que é preferível trabalhar com funções características sobre mgf's.

Questões.

  1. Quais são alguns exemplos em que os mgf são mais úteis que as funções características?
  2. O que se pode fazer com um mgf que não se pode fazer com uma função característica?
Artem Mavrin
fonte
1
A chave desta pergunta não é a palavra "introdutória" perto do fim? Faria algum sentido pedagógico introduzir algo que envolva a análise de números complexos em um curso que pressupõe apenas uma exposição mínima ao (e não se sinta confortável com) o cálculo elementar e, muitas vezes, nem isso?
whuber
1
@whuber Isso era algo que eu pensava assim, mas eu não quero que a minha pergunta ser sobre pedagogia, então talvez eu deveria remover o último parágrafo
Artem Mavrin
Uma resposta parcial está aqui: stats.stackexchange.com/questions/304066/…
kjetil b halvorsen

Respostas:

3

Essa é uma boa pergunta, mas ampla, por isso não posso prometer que direi tudo sobre isso que deve ser dito. A resposta curta é que as técnicas rivais diferem não no que eles podem fazer, mas em quão bem eles podem fazê-lo.

Funções características requerem cuidado extra devido ao papel de números complexos. Não é que o aluno precise saber sobre números complexos; é que o cálculo envolvido tem armadilhas sutis. Por exemplo, posso obter o MGF de uma distribuição Normal apenas preenchendo o quadrado em uma substituição de deslocamento variável, mas muitas fontes fingem descuidadamente que a abordagem usando funções características é igualmente fácil. Não é, porque a famosa normalização da integral gaussiana não diz nada sobre integração em com . Ah, ainda podemos avaliar a integral se formos cuidadosos com os contornos e, de fato, há uma abordagem ainda mais fácil, na qual mostramos integrando por partes que umic+RcR{0}N(0,1)a função característica da distribuição satisfaz . Mas a abordagem do MGF é ainda mais simples e a maioria das distribuições que os alunos precisam ter no início um MGF convergente em um segmento de linha (por exemplo, Laplace) ou meia-linha (por exemplo, gama, geométrico, binômio negativo) ou todo o (por exemplo, Beta, binomial, Poisson, Normal). De qualquer forma, isso é suficiente para estudar momentos.ϕ(t)ϕ˙=tϕR

Acho que não há nada que você possa fazer apenas com o MGF, mas você usa o que é mais fácil para a tarefa em questão. Aqui está uma para você: qual é a maneira mais fácil de calcular os momentos de uma distribuição Poisson? Eu diria que é usar uma técnica diferente novamente, a função geradora de probabilidade . Então o símbolo Pochhammer em queda fornece . Em geral, geralmente vale a pena usar o PGF para distribuições discretas, o MGF para distribuições contínuas limitadas ou com decaimento superexponencial nas caudas do PDF e a função característica quando você realmente precisa.G(t)=EtX=expλ(t1)(X)kE(X)k=G(k)(1)=λk

E, dependendo da pergunta que você está fazendo, você pode achar prudente usar a função de geração cumulativa, seja ela definida como o logaritmo do MGF ou CF. Por exemplo, vou deixar como um exercício que a definição de log cumulativos de MGF para o máximo de iids for , que fornece um cálculo muito mais fácil da média e da variação (respectivamente e ) do que se você os tivesse escrito em termos de momentos.n Exp(1)κm=(m1)!k=1nkmκ1κ2

JG
fonte
2
Eu não entendo sua observação sobre "integração em " porque o cf é definido como uma integral de uma função de valor complexo em Ele não precisa ser visto como uma integral de contorno. Para quem não se sente à vontade com números complexos, pode ser visto como um par de integrais reais de qualquer maneira. Não está claro como o mgf é "mais simples" em qualquer aspecto. De fato, o cf é mais simples no sentido de que não é preciso se preocupar com convergência. R .ic+R,R.
whuber
1
@whuber O que eu quero dizer é . R12πexp(x22+itx)dx=it+R12πexp(y22t22)dt
JG
Eu suspeitava disso. Mas isso não é apenas um artefato de como alguém pode escolher avaliar a integral, em vez de ser qualquer característica inerente da própria cf?
whuber
@whuber O problema é que muitas fontes fingem que a substituição funciona tão diretamente quanto no caso do MGF, o que não acontece.
JG
1
Você se importaria de elaborar um pouco o porquê disso não acontecer? Não vejo nada problemático nesse caso em particular; e, em geral, como a integral original sobre é convergente, não se esperaria nenhum problema com substituições desse tipo. R
whuber
3

Se sua variável aleatória tiver todos os seus momentos, o MGF existe e geralmente é pelo menos tão útil quanto a função característica para provas.

Para responder à sua pergunta, quando existe a MGF, que fornece a base para muitos cálculos extrema de valor relacionadas com X . O mais simples dos quais é (para t0 ),

P(X>r)=P(etX>etr)MX(t)/etr.

Aqui, os rhs agora podem ser minimizados em t . Estranhamente, esse limite é uma das poucas maneiras simples de obter estimativas de eventos raros. A área geral disso é a Teoria dos Grandes Desvios , onde é preciso fazer uma tonelada de trabalho para obter limites melhores (mais rígidos). Um exemplo comum disso é olhar para Sn=X1++Xn , de modo que quando o MGF de X1 existe, é possível mostrar P(|SnE[X]|>nr)decai exponencialmente em n . Isso é mais conhecido como Teorema de Cramer .

Aqui estão algumas notas compactas sobre isso.

Alex R.
fonte
1
Tudo no seu primeiro parágrafo já está mencionado na pergunta, exceto a última frase, que eu acho falsa. Por exemplo, todos os momentos da distribuição log-normal existem, mas seu mgf é indefinido para qualquer número real positivo. A segunda parte da sua resposta é muito útil porque ele destaca uma aplicação de MGF é que, aparentemente, não tem nenhuma função analógica característica
Artem Mavrin