Intervalo de confiança para variação dada uma observação

25

Este é um problema da "7ª Olimpíada de Estudantes de Kolmogorov na Teoria da Probabilidade":

Dada uma observação de uma distribuição com ambos os parâmetros desconhecidos, forneça um intervalo de confiança para com um nível de confiança de pelo menos 99%.XNormal(μ,σ2)σ2

Parece-me que isso deveria ser impossível. Eu tenho a solução, mas ainda não a li. Alguma ideia?

Vou postar a solução em alguns dias.

[Acompanhamento editar: solução oficial postada abaixo. A solução do Cardinal é mais longa, mas oferece um melhor intervalo de confiança. Agradecemos também a Max e Glen_b por sua contribuição.]

Jonathan Christensen
fonte
11
Parece impossível para mim também; Aguardo a resposta
Peter Flom - Reinstate Monica
11
Confira este site .
assumednormal
3
Aqui está um artigo com melhor formatação: papel .
assumednormal
Heh. Lembro-me de ler um artigo sobre essas coisas (intervalos de uma observação) há muitos anos. Pode ter sido esse .
Glen_b -Reinstala Monica 2/12/12
11
@ Max, obrigado pelo link! Ainda não tive tempo de olhar atentamente, mas farei. Eu postei a resposta "oficial" abaixo.
Jonathan Christensen

Respostas:

17

Visto pelas lentes das desigualdades de probabilidade e conexões com o caso de observação múltipla, esse resultado pode não parecer tão impossível ou, pelo menos, parecer mais plausível.

Permita que com e desconhecido. Podemos escrever para .μ σ 2 X = σ Z + μ Z N ( 0 , 1 )XN(μ,σ2)μσ2X=σZ+μZN(0,1)

Reivindicação principal : é um intervalo de confiança para que é o quantil level de uma distribuição qui-quadrado com um grau de liberdade. Além disso, uma vez que este intervalo tem exactamente cobertura quando , que é o mais estreito intervalo possível da forma para alguns .( 1 - α ) σ 2 q α α ( 1 - α ) μ = 0 [ 0 , b X 2 ) b R[0,X2/qα)(1α)σ2qαα (1α)μ=0[0,bX2)bR

Uma razão para otimismo

Lembre-se de que no caso , com , o intervalo de confiança típico para é que é o quantil -level de um qui-quadrado com graus de liberdade. Isso, é claro, vale para qualquer . Embora este seja o intervalo mais popular (chamado de intervalo de cauda igual por razões óbvias), não é o único nem o de menor largura! Como deve ser aparente, outra seleção válida é T = Σ n i = 1 ( X i - ˉ X ) 2 ( 1 - α ) σ 2 ( tn2T=i=1n(XiX¯)2 (1α)σ2q k , a a k μ ( 0 , T

(Tqn1,(1α)/2,Tqn1,α/2),
qk,aakμ
(0,Tqn1,α).

Como , então também tem cobertura de pelo menos . ( 0 , Σ n i = 1 X 2 iTi=1nXi2( 1 - α )

(0,i=1nXi2qn1,α),
(1α)

Visto sob essa luz, podemos estar otimistas de que o intervalo na reivindicação principal é verdadeiro para . A principal diferença é que não há distribuição qui-quadrado de zero grau de liberdade para o caso de uma única observação; portanto, devemos esperar que o uso de um quantil de um grau de liberdade funcione.n=1

Meio passo em direção ao nosso destino ( explorando a cauda direita )

Antes de mergulhar em uma prova da alegação principal, vamos primeiro examinar uma alegação preliminar que não é tão forte ou satisfatória estatisticamente, mas talvez ofereça algumas informações adicionais sobre o que está acontecendo. Você pode pular para a prova da reivindicação principal abaixo, sem muito (se houver) perda. Nesta seção e na próxima, as provas - embora um pouco sutis - são baseadas apenas em fatos elementares: monotonicidade de probabilidades e simetria e unimodalidade da distribuição normal.

Reivindicação auxiliar : é um intervalo de confiança para desde que . Aqui é o quantil level de um normal padrão.( 1 - α ) σ 2 α > 1 / 2 z α α[0,X2/zα2)(1α)σ2α>1/2zαα

Prova . epor simetria, portanto, no que se segue, podemos obter sem perda de generalidade. Agora, para e , e, com , vemos que Isso funciona apenas para , pois é isso que é necessário para .| σ Z + μ | d = | - σ Z + μ | μ 0 θ 0 μ 0 P ( | X | > θ ) P ( X > θ ) = P ( σ Z + μ > θ ) P ( Z|X|=|X||σZ+μ|=d|σZ+μ|μ0θ0μ0θ = z α σ P ( 0 σ 2 < X 2 / z 2 α ) 1 - α

P(|X|>θ)P(X>θ)=P(σZ+μ>θ)P(Z>θ/σ),
θ=zασα > 1 / 2 z α > 0
P(0σ2<X2/zα2)1α.
α>1/2zα>0

Isso prova a reivindicação auxiliar. Embora ilustrativo, é desagradável do ponto de vista estatístico, pois requer um absurdamente grande para funcionar.α

Comprovando a reivindicação principal

Um refinamento do argumento acima leva a um resultado que funcionará para um nível de confiança arbitrário. Primeiro, observe que Definir e . Então, Se pudermos mostrar que o lado direito aumenta em para cada fixo , podemos empregar um argumento semelhante ao do argumento anterior. Isso é pelo menos plausível, pois gostaríamos de acreditar que, se a média aumentar, torna-se mais provável que vejamos um valor com um módulo que exceda

P(|X|>θ)=P(|Z+μ/σ|>θ/σ).
a=μ/σ0b=θ/σ0
P(|Z+a|>b)=Φ(ab)+Φ(ab).
abb. (No entanto, devemos observar a rapidez com que a massa está diminuindo na cauda esquerda!)

Defina . Então Observe que e para positivo , está diminuindo em . Agora, para , é fácil ver que . Esses fatos juntos facilmente implicam que para todo e qualquer fixo .fb(a)=Φ(ab)+Φ(ab)

fb(a)=φ(ab)φ(ab)=φ(ab)φ(a+b).
fb(0)=0uφ(u)ua(0,2b)φ(ab)φ(b)=φ(b)
fb(a)0
a0b0

Assim, temos mostrado que para e , a0b0

P(|Z+a|>b)P(|Z|>b)=2Φ(b).

Desvendando tudo isso, se tomarmos , obteremos que estabelece a reivindicação principal.θ=qασ

P(X2>qασ2)P(Z2>qα)=1α,

Observação final : Uma leitura cuidadosa do argumento acima mostra que ele usa apenas as propriedades simétricas e unimodais da distribuição normal. Portanto, a abordagem funciona de forma análoga para obter intervalos de confiança a partir de uma única observação de qualquer família de escala de localização unimodal simétrica, por exemplo, distribuições de Cauchy ou Laplace.

cardeal
fonte
Uau! e espera-se que os alunos apresentem esse tipo de argumento no curto período de um exame da Olimpíada?
precisa saber é o seguinte
11
@Dilip: não faço ideia! Não estou familiarizado com o formato dessa Olimpíada ou com o que é esperado em termos de solução. De uma leitura literal, acho que a resposta de Scortchi seria aceitável. Eu estava mais interessado em tentar descobrir até que ponto alguém poderia chegar com uma solução "não trivial". Minha própria exploração (bastante mínima) seguiu a mesma linha de pensamento descrita na resposta (com um desvio). É bem provável que exista uma solução melhor. :-)
cardeal
Isso é consideravelmente mais longo do que a solução "oficial", mas fornece uma ligação melhor à variação, por isso estou marcando-a como a resposta "correta". Postei a resposta "oficial" abaixo, bem como alguns resultados e discussões de simulação. Obrigado, @ cardinal!
Jonathan Christensen
2
@ Jonathan: Obrigado. Sim, eu poderia ter tornado a prova um pouco mais concisa. Devido à grande variedade de antecedentes dos participantes aqui, muitas vezes eu me permito com detalhes extras (ou, talvez, excessivos). :-)
cardeal
12

Hora de acompanhar! Aqui está a solução que me foi dada:

Construiremos um intervalo de confiança no formato , onde é uma estatística. Por definição, este será um intervalo de confiança com nível de confiança de pelo menos 99% se Observamos que a densidade da distribuição não excede . Portanto, para cada . Segue que Conectando[0,T(X))T()

(μR)(σ>0)Pμ,σ2(σ2>T(X))<0.01.
N(μ,σ2)1/σ2πP(|X|a)a/σa0
tP(|X|/σt)=P(X2t2σ2)=P(σ2X2/t2).
t=0.01obtemos que a estatística apropriada éT(X)=10000X2.

O intervalo de confiança (que é muito amplo) é um pouco conservador na simulação, sem cobertura empírica (em 100.000 simulações) menor que 99,15%, pois variei o CV em várias ordens de magnitude.

Para comparação, também simulei o intervalo de confiança do cardeal. Devo observar que o intervalo do cardeal é um pouco menor - no caso de 99%, ele acaba chegando a cerca de , em oposição aos na solução fornecida. A cobertura empírica é correta no nível nominal, novamente em muitas ordens de magnitude para o CV. Então o intervalo dele definitivamente vence.6300X210000X2

Não tive tempo de olhar atentamente para o artigo publicado por Max, mas pretendo dar uma olhada nisso e posso acrescentar alguns comentários a respeito mais tarde (ou seja, antes de uma semana). Esse artigo reivindica um intervalo de confiança de 99% de , que possui uma cobertura empírica ligeiramente menor (cerca de 98,85%) do que a cobertura nominal para currículos grandes em minhas breves simulações.(0,4900X2)

Jonathan Christensen
fonte
11
(+1) Essa é uma boa solução. Você deve ter vez de na equação de exibição? tt
cardeal
2
Mais alguns pontos: sua solução pode ser muito próxima da minha, sem nenhuma alteração no argumento. Observe que você pode reivindicar que . Então o intervalo se torna para qualquer . O uso de produz versus na minha resposta. Quanto maior o nível de confiança (ou seja, menor o ), mais próximo o seu método se compara do meu (embora seu intervalo seja sempre maior). P(|X|a)2a/σ2π(0,2X2/πα2)αα=0.01T(X)6366.198X21/q0.016365.864α
cardeal
11
Segundo, não examinei esse artigo, mas tenho fortes dúvidas de que possa ser um intervalo de confiança de 99% válido. De fato, considere todos os intervalos de confiança da forma para alguns . Então, quando , temos que é exatamente qui-quadrado com um grau de liberdade e, portanto, o menor podemos selecionar nesse caso é . Em outras palavras, o intervalo dado na minha resposta é o mais estreito possível da forma declarada. ( 0 , b X 2 ) b μ = 0 X 2 / σ 2 b b = 1 / q α(0,4900X2)(0,bX2)bμ=0X2/σ2bb=1/qα
cardeal
11
Fiz a correção (suspeita) de erro de digitação. Além disso, pchisq(1/4900,1,lower.tail=F)em Rretorno 0.9886, bem próximo dos resultados da simulação para o . (0,4900X2)
cardeal
11
Obrigado por todos os comentários, @ cardinal. Acho que a sua alteração está correta, embora eu a tenha digitado da maneira que estava nas soluções originais - erro de digitação, acho.
Jonathan Christensen
5

Os ICs presumivelmente.(0,)

Scortchi - Restabelecer Monica
fonte
11
Eu acho que seria útil você dizer por que você não pode obter um intervalo de confiança de comprimento finito.
assumido normal
11
@ Max Eu não sou inteligente o suficiente - mas a pergunta não pediu uma.
Scortchi - Restabelece Monica
4
+1 para isso. A pergunta não dizia um IC com cobertura mínima e, de fato, implica que isso pode ser aceitável por meio de suas palavras curiosas, "um intervalo de confiança com um nível de confiança de pelo menos 99%".
Ari B. Friedman