Estou interessado na seguinte versão unilateral de Cantelli da desigualdade de Chebyshev :
Basicamente, se você conhece a média e a variação da população, pode calcular o limite superior da probabilidade de observar um determinado valor. (Essa foi a minha compreensão, pelo menos.)
No entanto, eu gostaria de usar a média da amostra e a variação da amostra em vez da média e da variação reais da população.
Estou supondo que, uma vez que isso introduziria mais incerteza, o limite superior aumentaria.
Existe uma desigualdade análoga à acima, mas que usa a média e variância da amostra?
Edit : O "exemplo" analógico da desigualdade de Chebyshev (não de um lado), foi elaborado. A página da Wikipedia tem alguns detalhes. No entanto, não tenho certeza de como isso se traduziria no caso unilateral que tenho acima.
Respostas:
Sim, podemos obter um resultado análogo usando a média e variância da amostra, com, talvez, algumas pequenas surpresas surgindo no processo.
Primeiro, precisamos refinar um pouco a declaração da pergunta e definir algumas suposições. Importante, deve ficar claro que não podemos esperar substituir a variação populacional pela variação da amostra no lado direito, pois o último é aleatório ! Portanto, reorientamos nossa atenção para a desigualdade equivalente Caso não esteja claro se são equivalentes, observe que simplesmente substituímos por na desigualdade original sem qualquer perda de generalidade.t t σ
Segundo, assumimos que temos uma amostra aleatória e estamos interessados em um limite superior para a quantidade análoga , onde é a amostra média e é o desvio padrão da amostra.P ( X 1 - ˉ X ≥ t S ) ˉ X SX1,…,Xn P(X1−X¯≥tS) X¯ S
Meio passo à frente
Observe que já aplicando a desigualdade original de Chebyshev unilateral a , obtemos que que , que é menor que o lado direito da versão original. Isso faz sentido! Qualquer realização específica de uma variável aleatória de uma amostra tenderá a ser (ligeiramente) mais próxima da média da amostra para a qual ela contribui do que da média da população. Como veremos abaixo, substituiremos por sob premissas ainda mais gerais. P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯ σ2=Var(X1)σS
Uma versão de exemplo do Chebyshev unilateral
Nota : Nós não assumir que o quer ter finito média ou variância!Xi
Prova . A idéia é adaptar a prova da desigualdade original de Chebyshev, unilateral, e empregar simetria no processo. Primeiro, defina para conveniência notacional. Em seguida, observe que P ( Y 1 ≥ t S ) = 1Yi=Xi−X¯
Agora, para qualquer , em , { S > 0 } 1 ( Y i ≥ t S ) = 1 ( Y i + t c S ≥ t S ( 1 + c ) ) ≤ 1 ( ( Y i + t c S ) 2 ≥ t 2 ( 1 + c ) 2 S 2 ) ≤ ( Yc>0 {S>0}
Então, uma vez que e .ˉ Y = 0 Σ i Y 2 i = ( n - 1 ) S 2
O lado direito é uma constante ( ! ), Portanto, assumir as expectativas de ambos os lados gera, Finalmente, minimizando sobre , produz , que após um pouco de álgebra estabelece o resultado.
Essa condição técnica traquina
Observe que tivemos que assumir para poder dividir por na análise. Isso não é problema para distribuições absolutamente contínuas, mas representa um inconveniente para distribuições discretas. Para uma distribuição discreta, há alguma probabilidade de que todas as observações são iguais, caso em que para todos os e .P(S=0)=0 S2 0=Yi=tS=0 i t>0
Podemos nos desviar definindo . Então, um cuidadoso relato do argumento mostra que tudo passa praticamente inalterado e temosq=P(S=0)
Prova . Divida nos eventos e . A prova anterior passa por e o caso é trivial.{S>0} {S=0} {S>0} {S=0}
Uma desigualdade ligeiramente mais limpa resulta se substituirmos a desigualdade não estrita na declaração de probabilidade por uma versão estrita.
Observação final : a versão amostral da desigualdade não exigiu suposições sobre (exceto que ela não é quase certamente constante no caso de desigualdade não estrita, que a versão original também assume tacitamente), em essência, porque a média da amostra e a variação da amostra sempre existe, independentemente de seus análogos populacionais existirem.X
fonte
Este é apenas um complemento à resposta engenhosa do @cardinal. A desigualdade de Samuelson afirma que, para uma amostra de tamanho , quando temos pelo menos três valores distintos dos realizados , ele sustenta que onde é calculado sem a correção de viés, .n xi
Então, usando a notação da resposta do cardeal, podemos afirmar que
Como exigimos três valores distintos, teremos por suposição. Então, definindo na desigualdade do Cardinal (a versão inicial) obtemosS≠0 t=n−1−−−−−√
Eq. é obviamente compatível com a eq. . A combinação dos dois nos diz que a desigualdade do cardeal é útil como uma declaração probabilística para .[2] [1] 0<t<n−1−−−−−√
Se a desigualdade do cardeal exigir que seja calculado com correção de viés (chame isso ), as equações se tornarãoS S~
e escolhemos para obter através da desigualdade do Cardinalt=n−1n√
fonte