Este é um problema da "7ª Olimpíada de Estudantes de Kolmogorov na Teoria da Probabilidade":
Dada uma observação de uma distribuição com ambos os parâmetros desconhecidos, forneça um intervalo de confiança para com um nível de confiança de pelo menos 99%.
Parece-me que isso deveria ser impossível. Eu tenho a solução, mas ainda não a li. Alguma ideia?
Vou postar a solução em alguns dias.
[Acompanhamento editar: solução oficial postada abaixo. A solução do Cardinal é mais longa, mas oferece um melhor intervalo de confiança. Agradecemos também a Max e Glen_b por sua contribuição.]
probability
normal-distribution
confidence-interval
variance
Jonathan Christensen
fonte
fonte
Respostas:
Visto pelas lentes das desigualdades de probabilidade e conexões com o caso de observação múltipla, esse resultado pode não parecer tão impossível ou, pelo menos, parecer mais plausível.
Permita que com e desconhecido. Podemos escrever para .μ σ 2 X = σ Z + μ Z ∼ N ( 0 , 1 )X∼N(μ,σ2) μ σ2 X=σZ+μ Z∼N(0,1)
Uma razão para otimismo
Lembre-se de que no caso , com , o intervalo de confiança típico para é que é o quantil -level de um qui-quadrado com graus de liberdade. Isso, é claro, vale para qualquer . Embora este seja o intervalo mais popular (chamado de intervalo de cauda igual por razões óbvias), não é o único nem o de menor largura! Como deve ser aparente, outra seleção válida é T = Σ n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( tn≥2 T=∑ni=1(Xi−X¯)2 (1−α) σ2 q k , a a k μ ( 0 , T
Como , então também tem cobertura de pelo menos . ( 0 , Σ n i = 1 X 2 iT≤∑ni=1X2i ( 1 - α )
Visto sob essa luz, podemos estar otimistas de que o intervalo na reivindicação principal é verdadeiro para . A principal diferença é que não há distribuição qui-quadrado de zero grau de liberdade para o caso de uma única observação; portanto, devemos esperar que o uso de um quantil de um grau de liberdade funcione.n=1
Meio passo em direção ao nosso destino ( explorando a cauda direita )
Antes de mergulhar em uma prova da alegação principal, vamos primeiro examinar uma alegação preliminar que não é tão forte ou satisfatória estatisticamente, mas talvez ofereça algumas informações adicionais sobre o que está acontecendo. Você pode pular para a prova da reivindicação principal abaixo, sem muito (se houver) perda. Nesta seção e na próxima, as provas - embora um pouco sutis - são baseadas apenas em fatos elementares: monotonicidade de probabilidades e simetria e unimodalidade da distribuição normal.
Reivindicação auxiliar : é um intervalo de confiança para desde que . Aqui é o quantil level de um normal padrão.( 1 - α ) σ 2 α > 1 / 2 z α α[0,X2/z2α) (1−α) σ2 α>1/2 zα α
Prova . epor simetria, portanto, no que se segue, podemos obter sem perda de generalidade. Agora, para e , e, com , vemos que Isso funciona apenas para , pois é isso que é necessário para .| σ Z + μ | d = | - σ Z + μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 P ( | X | > θ ) ≥ P ( X > θ ) = P ( σ Z + μ > θ ) ≥ P ( Z| X| = | -X| | σZ+ μ | =d| -σZ+ μ | μ ≥ 0 θ ≥ 0 μ ≥ 0 θ = z α σ P ( 0 ≤ σ 2 < X 2 / z 2 α ) ≥ 1 - α
Isso prova a reivindicação auxiliar. Embora ilustrativo, é desagradável do ponto de vista estatístico, pois requer um absurdamente grande para funcionar.α
Comprovando a reivindicação principal
Um refinamento do argumento acima leva a um resultado que funcionará para um nível de confiança arbitrário. Primeiro, observe que Definir e . Então, Se pudermos mostrar que o lado direito aumenta em para cada fixo , podemos empregar um argumento semelhante ao do argumento anterior. Isso é pelo menos plausível, pois gostaríamos de acreditar que, se a média aumentar, torna-se mais provável que vejamos um valor com um módulo que exceda
Defina . Então Observe que e para positivo , está diminuindo em . Agora, para , é fácil ver que . Esses fatos juntos facilmente implicam que para todo e qualquer fixo .fb( a ) = Φ ( a - b ) + Φ ( - a - b )
Assim, temos mostrado que para e ,a ≥ 0 b ≥ 0
Desvendando tudo isso, se tomarmos , obteremos que estabelece a reivindicação principal.θ = qα--√σ
Observação final : Uma leitura cuidadosa do argumento acima mostra que ele usa apenas as propriedades simétricas e unimodais da distribuição normal. Portanto, a abordagem funciona de forma análoga para obter intervalos de confiança a partir de uma única observação de qualquer família de escala de localização unimodal simétrica, por exemplo, distribuições de Cauchy ou Laplace.
fonte
Hora de acompanhar! Aqui está a solução que me foi dada:
O intervalo de confiança (que é muito amplo) é um pouco conservador na simulação, sem cobertura empírica (em 100.000 simulações) menor que 99,15%, pois variei o CV em várias ordens de magnitude.
Para comparação, também simulei o intervalo de confiança do cardeal. Devo observar que o intervalo do cardeal é um pouco menor - no caso de 99%, ele acaba chegando a cerca de , em oposição aos na solução fornecida. A cobertura empírica é correta no nível nominal, novamente em muitas ordens de magnitude para o CV. Então o intervalo dele definitivamente vence.6300X2 10000X2
Não tive tempo de olhar atentamente para o artigo publicado por Max, mas pretendo dar uma olhada nisso e posso acrescentar alguns comentários a respeito mais tarde (ou seja, antes de uma semana). Esse artigo reivindica um intervalo de confiança de 99% de , que possui uma cobertura empírica ligeiramente menor (cerca de 98,85%) do que a cobertura nominal para currículos grandes em minhas breves simulações.(0,4900X2)
fonte
pchisq(1/4900,1,lower.tail=F)
emR
retorno0.9886
, bem próximo dos resultados da simulação para o .Os ICs presumivelmente.(0,∞)
fonte