Dada uma sequência de variáveis aleatórias iid, digamos, para , estou tentando limitar o número esperado de vezes que a média empírica excederá um valor, , enquanto continuamos a desenhar amostras, ou seja:
Se assumirmos que para alguns , podemos usar a desigualdade de Hoeffding para chegar a
O que parece bom (talvez), mas, na verdade, é muito limitado, existem maneiras melhores de limitar esse valor? Espero que possa haver uma maneira, já que os diferentes eventos (para cada ) claramente não são independentes, não tenho conhecimento de nenhuma maneira de explorar essa dependência. Além disso, seria bom remover a restrição de que é maior que a média.c
edit : A restrição de ser maior que a média pode ser removida se usarmos a desigualdade de Markov da seguinte maneira:
fonte
Respostas:
Essa é uma abordagem feita à mão, e eu realmente aprecio alguns comentários sobre ela (e as críticas são geralmente as mais úteis). Se bem entendi, o OP calcula as médias da amostra , onde cada amostra contém a amostra anterior +1 da observação de um novo rv Denote a distribuição da média de cada amostra. Então nós podemos escrever Fjx¯j Fj
Considere-se um tamanho da amostra , após o que a distribuição da média da amostra é quase normal, denotar que . Então nós podemos escreverLm G^
Resolvendo obtemos onde é o padrão normal cdf, é o desvio padrão do processo iid e é sua média. Inserindo no limite e reorganizando, obtemos L j(c)=1-Φ( √G^j(c)
Observe que esse limite depende também da variação do processo. Este é um limite melhor do que o apresentado na pergunta? Isso dependerá crucialmente de quão "rapidamente" a distribuição da média da amostra se torna "quase normal". Para dar um exemplo numérico, assuma que . Suponha também que as variáveis aleatórias sejam uniformes em . Então e . Considere um desvio de 10% da média, ou seja, defina . então: já para o limite que proponho (que é significativo para ) fica mais apertado. Para o limite de Hoeffding ém=30 [0,1] σ=112−−√ μ=12 a=0.05 n=34 n>30 n=100 78.5 enquanto o limite que proponho é . O Hoeffding ligado converge para enquanto o ligado propomos a Se aumentar a discrepância entre os dois limites reduz mas permanece visível: para um desvio de 20%, , o Hoeffding ligado converge a , enquanto o O limite que proponho converge para (ou seja, a soma dos cdfs normais contribui muito pouco para o limite geral).
De um modo mais geral, notamos que para o limite de Hoeffding converge para36.2 ≈199.5 ≈38.5 a a=0.1 49.5 30.5
n→∞
Como para valores pequenos de (que é bastante o caso de interesse) se torna um número grande, ainda existe o caso de superá-lo com força, mesmo que a amostra seja tal que a distribuição da média da amostra converja lentamente para a distribuição normal.a Hb Ab
fonte