Se é uma distribuição de probabilidade com valores diferentes de zero em , para que tipo (s) de existe uma constante tal que para todos os?
A desigualdade acima é na verdade uma divergência de Kullback-Leibler entre a distribuição e uma versão compactada dela . Descobri que essa desigualdade vale para as distribuições Exponential, Gamma e Weibull e estou interessado em saber se isso funciona para uma classe maior de distribuições de probabilidade.
Alguma idéia do que essa desigualdade significa?
Respostas:
Preliminares
Escrever
Os logaritmos e o relacionamento entre os e p ( x ( 1 + ε ) ) sugerem que expressa ambos p e o seu argumento como exponenciais. Para esse fim, definap(x) p(x(1+ϵ)) p
para todo real para o qual o lado direito é definido e igual a - ∞ sempre que p ( e y ) = 0 . Observe que a mudança das variáveis x = e y implica d x = e y d y e (considerando p como a densidade de uma distribuição) que a Lei da Probabilidade Total pode, assim, ser expressa comoy −∞ p(ey)=0 x=ey dx=eydy p
Vamos assumir quando y → ± ∞ .eq(y)+y→0 y→±∞ Isso exclui as distribuições de probabilidade com infinitos picos de densidade próximos a 0 ou ∞ . Em particular, se as caudas de p forem eventualmente monotônicas, ( 1 ) implica essa suposição, mostrando que não é grave.p 0 ∞ p (1)
Para facilitar o trabalho com os logaritmos, observe também que
Como os cálculos a seguir serão executados até múltiplos de , definaϵ2
Poderíamos também substituir por e δ , com δ = 0 correspondendo a ϵ = 0 e positivo δ correspondendo a positivo ϵ .1+ϵ eδ δ=0 ϵ=0 δ ϵ
Análise
Uma maneira óbvia em que a desigualdade pode falhar seria para a integral a divergir por algum ε ∈ ( 0 , 1 ] . Isso aconteceria se, por exemplo, houvesse qualquer intervalo adequado [ u , v ] de números positivos, não importa quão pequeno, em que p fosse identicamente zero, mas p não fosse zero no intervalo [ u - ϵ , v - ϵ ]Ip(ϵ) ϵ∈(0,1] [u,v] p p [u−ϵ,v−ϵ] . Isso faria com que o integrando fosse infinito com probabilidade positiva.
Because the question is unspecific concerning the nature ofp , we could get bogged down in technical issues concerning how smooth p might be. Let's avoid such issues, still hoping to gain some insight, by assuming that q everywhere has as many derivatives as we might care to use. (Two will suffice if q′′ is continuous.) Because that guarantees q remains bounded on any bounded set, it implies that p(x) is never zero when x>0 .
Note que a questão realmente diz respeito ao comportamento de quando ϵ se aproxima de zero de cima. Como essa integral é uma função contínua de ϵ no intervalo ( 0 , 1 ] , ela atinge um máximo de M p ( a ) quando ϵ é restrito a qualquer intervalo positivo [ a , 1 ] , permitindo escolher c = M p ( a ) / a 2 , porque obviamenteIp(ϵ) ϵ ϵ (0,1] Mp(a) ϵ [a,1] c=Mp(a)/a2
makes the inequality work. This is why we need only be concerned with the calculation moduloϵ2 .
Solution
Using the changes of variable fromx to y , from p to q , and ϵ to δ , let's calculate Ip(ϵ) through second order in ϵ (or δ ) in the hope of achieving a simplification. To that end define
to be the order-2 remainder in the Taylor expansion of q around y .
Changing variables toq(y)+y in the left hand integral shows it must vanish, as remarked in the assumption following (1) . Changing variables back to x=ey in the right hand integral gives
The inequality holds (under our various technical assumptions) if and only if the coefficient ofδ2 on the right hand side is finite.
Interpretation
This is a good point to stop, because it appears to uncover the essential issue:Ip(ϵ) is bounded by a quadratic function of ϵ precisely when the quadratic error in the Taylor expansion of q doesn't explode (relative to the distribution) as y approaches ±∞ .
Let's check some of the cases mentioned in the question: the Exponential and Gamma distributions. (The Exponential is a special case of the Gamma.) We never have to worry about scale parameters, because they merely change the units of measurement. Only non-scale parameters matter.
Here, becausep(x)=xke−x for k>−1 ,
Similar calculations imply the inequality for Weibull distributions, Half-Normal distributions, Lognormal distributions, etc. In fact, to obtain counterexamples we would need to violate at least one assumption, forcing us to look at distributions wherep vanishes on some interval, or is not continuously twice differentiable, or has infinitely many modes. These are easy tests to apply to any family of distributions commonly used in statistical modeling.
fonte