Seja uma sequência de variáveis aleatórias iid amostradas de uma distribuição alfa estável , com os parâmetros . α = 1,5 ,
Agora considere a sequência , em que , para .
Quero estimar o percentil .
Minha idéia é executar uma espécie de simulação de Monte-Carlo:
l = 1;
while(l < max_iterations)
{
Generate $X_1, X_2, \ldots, X_{3n}$ and compute $Y_1, Y_2, \ldots, Y_{n}$;
Compute $0.01-$percentile of current repetition;
Compute mean $0.01-$percentile of all the iterations performed;
Compute variance of $0.01-$percentile of all the iterations performed;
Calculate confidence interval for the estimate of the $0.01-$percentile;
if(confidence interval is small enough)
break;
}
Chamando a média de todos os percentis de amostra calculados como e sua variação , para calcular o intervalo de confiança apropriado para , eu recorro à forma Forte do Teorema do Limite Central :- μ n σ 2 n μ
Seja uma sequência de variáveis aleatórias iid com e . Defina a média da amostra como . Então, tem uma distribuição normal padrão limitante, ou seja, E [ X i ] = μ 0 < V [ X i ] = σ 2 < ∞ μ n = ( 1 / n ) Σ n i = 1 X i ( μ n - μ ) / √μ n -μ
e o teorema de Slutksy para concluir que
Então, um - intervalo de confiança para éμ
Questões:
1) Minha abordagem está correta? Como posso justificar a aplicação do CLT? Quero dizer, como posso mostrar que a variação é finita? (Eu tenho que olhar para a variação de ? Porque eu não acho que seja finito ...)
2) Como posso mostrar que a média de todos os percentis da amostra computados converge para o valor real do percentil ? (Eu devo usar estatísticas de pedidos, mas não tenho certeza de como proceder; as referências são apreciadas.)
Respostas:
A variação de não é finita.Y Isso é porque uma variável alfa-estável com α = 3 / 2 (uma distribuição Holtzmark ) tem uma expectativa finito μ mas a sua variância é infinita. Se Y tivesse uma variância finita σ 2 , explorando a independência do X i e a definição de variância, poderíamos calcularX α = 3 / 2 μ Y σ2 XEu
Essa equação cúbica em tem pelo menos uma solução real (e até três soluções, mas não mais), o que implica que Var ( X ) seria finito - mas não é. Essa contradição comprova a afirmação.Var( X) Var( X)
Vamos passar para a segunda pergunta.
Qualquer quantil de amostra converge para o quantil verdadeiro à medida que a amostra cresce. Os próximos parágrafos comprovam esse ponto geral.
Seja a probabilidade associada (ou qualquer outro valor entre 0 e 1 , exclusivo). Faça F para a função de distribuição, de modo a que Z q = F - 1 ( q ) é o q th quantil.q= 0,01 0 0 1 1 F Zq= F- 1( q) qº
Tudo o que precisamos assumir é que (a função quantil) é contínua. Isso nos assegura que para qualquer ϵ > 0 existem probabilidades q - < q e q + > q para as quaisF- 1 ε > 0 q-< q q+> q
e que como , o limite do intervalo [ q - , q + ] é { q } .ϵ → 0 [ q-, q+] { q}
Considere qualquer amostra iid do tamanho . O número de elementos deste exemplo que são menos do que Z q - tem um binomial ( q - , N ) de distribuição, porque cada elemento tem, independentemente, uma possibilidade q - de ser menos do que Z q - . O Teorema do Limite Central (o usual!) Implica que, para n suficientemente grande , o número de elementos menor que Z q - é dado por uma distribuição Normal com média n q - e variação n q - (n Zq- ( q-, N ) q- Zq- n Zq- n q- (para uma aproximação arbitrariamente boa). Seja o CDF da distribuição normal padrão Φ . A chance de que essa quantidade exceda n q é, portanto, arbitrariamente próxima den q-( 1 - q-) Φ n q
Como o argumento no lado direito é um múltiplo fixo de √Φ , cresce arbitrariamente grande à medida quencresce. ComoΦé um CDF, seu valor se aproxima arbitrariamente próximo de1, mostrando que o valor limite dessa probabilidade é zero.n--√ n Φ 1 1
Em palavras: no limite, é quase certo que dos elementos da amostra não sejam menores que Z q - . Um argumento análogo prova que é quase certo que n q dos elementos da amostra não seja maior que Z q + . Juntos, isso implica que o quantil q de uma amostra suficientemente grande é extremamente provável que esteja entre Z q - ϵ e Z q + ϵ .n q Zq- n q Zq+ q Zq- ϵ Zq+ ϵ
fonte