Como provar se existe a média de uma função de densidade de probabilidade

9

É sabido que, dada uma variável aleatória com valor real com pdf , a média de (se existir) é encontrada por XfX

E[X]=Rxf(x)dx.

Pergunta geral: Agora, se alguém não pode resolver a integral acima em forma fechada, mas quer simplesmente determinar se a média existe e é finita, existe uma maneira de provar isso? Existe (talvez) algum teste que eu possa aplicar ao integrando para determinar se certos critérios são atendidos para que a média exista?

Pergunta específica do aplicativo: Eu tenho o seguinte pdf para o qual quero determinar se a média existe:

f(x)=|σ22μ1x+μ2σ12|σ13σ23a3(x)ϕ(μ2xμ1σ1σ2a(x))for xR,

onde , , e .μ1,μ2Rσ1,σ2>0a(x)=(x2σ12+1σ22)1/2ϕ(g(x))=12πeg2(x)/2

Eu tentei resolver para o meio sem sucesso.

Aaron Hendrickson
fonte
1
na sua pergunta específica, não é uma função de densidade adequada. suponha que , e , , então para . μ 1 = 1 μ 2 = 0 σ j = 1 j = 1 , 2 f ( x ) < 0 x < 0f(x)μ1=1μ2=0σj=1j=1,2f(x)<0x<0
EliKa
@EliKa Good find. Pode haver um erro de digitação. Vou verificar e corrigir a pergunta. Dito isto, ainda estou principalmente interessado na parte "como" da pergunta, ou seja, como eu chegaria a determinar se a média existe e é finita?
Aaron Hendrickson
2
Você poderia tentar delimitadora acima e abaixo por algumas funções não negativas e tal que você pode integrá-los. Se você pode integrar , sua distribuição tem uma média. Se , sua distribuição não tem significado. u ( x ) b ( x ) u ( x ) b ( x ) d x = |xf(x)|u(x)b(x)u(x)b(x)dx=
Ceph
@ Ceph Essa é uma boa sugestão. Essa técnica é baseada no "teorema do aperto"?
Aaron Hendrickson
1
@AaronHendrickson Idéia semelhante, mas (como eu a entendo) o teorema do aperto é um pouco diferente. Usando o ST aqui pode ter esta aparência: encontrar e que ligava (em vez de delimitadora como no meu comentário anterior) de tal forma que você pode encontrar , onde é a média da sua distribuição. Mas essa provavelmente não é uma estratégia plausível, já que seria difícil encontrar tais e . (Eles podem diferir de apenas em um conjunto de medidas 0 e, portanto, provavelmente não seria mais fácil de integrar do que .)b ( x ) x f ( x ) | x f ( x ) | u ( x ) d x = b ( x ) d x = u u u b x f ( x ) x f ( x )u(x)b(x)xf(x)|xf(x)|u(x)dx=b(x)dx=μμubxf(x)xf(x)
Ceph

Respostas:

12

Não existe uma técnica geral, mas existem alguns princípios simples. Uma é estudar o comportamento da cauda de comparando-o com funções tratáveis.f

Por definição, a expectativa é o limite duplo (como e variam independentemente)zyz

Ey,z[f]=limy,zyzxf(x)dx=limyy0xf(x)dx+limz0zxf(x)dx.

O tratamento das duas integrais à direita é o mesmo, então vamos nos concentrar na positiva. Um comportamento de que garante um valor limitador é compará-lo com a potência . Suponha que é um número para o qual Isso significa que existe um e um para o qual sempre que . Podemos explorar essa desigualdade quebrando a integração nas regiões onde e e aplicando-a na segunda região:x - p p lim inf x x p f ( x ) > 0. ε > 0 N > 1 x p f ( x ) ε x [ N , ) X < N X Nfxpp

lim infxxpf(x)>0.
ϵ>0N>1xpf(x)ϵx[N,)x<NxN

0zxf(x)dx=0Nxf(x)dx+Nzxf(x)dx=0Nxf(x)dx+Nzx1p(xpf(x))dx0Nxf(x)dx+Nzx1p(ϵ)dx=0Nxf(x)dx+ϵ2p(z2pN2p).

Desde que , o lado direito diverge como . Quando a integral é avaliada pelo logaritmo,p<2zp=2

Nzx12(ϵ)dx=ϵ(log(z)log(N)),

que também diverge.

A análise comparável mostra que se para , então existe. Da mesma forma, podemos testar se existe algum momento de : para , a expectativa de existe quando para alguns e não existe quando para alguns . Isso aborda a "questão geral".|x|pf(x)0p>2E[X]Xα>0|X|α|x|p+αf(x)0p>1lim inf|x|p+αf(x)>0p1

Vamos aplicar esse insight à pergunta. Por inspeção, fica claro que para grandes. Ao avaliar , podemos, portanto, descartar quaisquer termos aditivos que eventualmente serão inundados por. Assim, até uma constante diferente de zero, paraa(x)|x|/σ1|x|f|x|x>0

f(x)μ1xσ2x3ϕ(μ2xσ2x)=x2μ1σ2exp((μ22σ2)2).

Assim aproxima de uma constante diferente de zero. Pelo resultado anterior, a expectativa diverge.x2f(x)

Como é o menor valor de que funciona nesse argumento - passará a zero como para qualquer - é claro (e mais análise detalhada de confirmará) que a taxa de divergência é logarítmica. Ou seja, para grandese, pode ser aproximado de perto por uma combinação linear de e .p | x | p f ( x ) | x | p < 2 f | y | | z | E y , z [ f ] log ( | y | ) log ( |2p|x|pf(x)|x|p<2f|y||z|Ey,z[f]log(|y|)log(|z|)

whuber
fonte