Os problemas estatísticos que envolvem intervalos de confiança para uma média da população podem ser enquadrados em termos da seguinte função de ponderação :
Por exemplo, o intervalo de confiança de nível clássico padrão para a média de uma superpopulação infinita pode ser escrito como:
É trivial estabelecer os limites e usando a função quantil de a distribuição T. No contexto de intervalos de confiança, isso nos diz que o intervalo diminui para um único ponto à medida que diminuímos o nível de confiança e aumenta para toda a linha real à medida que aumentamos o nível de confiança. Outra propriedade intuitiva que deve ser mantida é que o intervalo diminui para um único ponto à medida que obtemos mais e mais dados, o que significa que:
Pergunta: forneça uma prova para esta última propriedade da função de ponderação.
Mais informações: Para qualquer leitor de matemática que não esteja familiarizado com os pontos críticos da distribuição T , o valor é uma função de definida pela equação implícita: n
fonte
Respostas:
Prova da desigualdade de Chebyshev
Aqui está uma prova usando a desigualdade de Chebyshev, .Pr ( | T| ≥kσ) ≤ 1k2
Se preenchermos e definirmos então temos um limiteσtν= νν- 2 1 / k2= α = Pr ( | T| ≥ tν, α / 2)
assim será delimitado acima portν, α / 2
adicionando o limite inferior óbvio e dividido porν+ 1----√
que espreme para zero para n→∞tn - 1 , α / 2/ n--√ n → ∞
fonte
Tenho certeza de que existe uma maneira mais fácil de fazer isso, mas o resultado é imediato a partir do seguinte:
A seguir, é uma aplicação bem conhecida do teorema de Slutsky que converge em distribuição para uma distribuição normal padrão. O resultado anterior implica que , ou seja, . Aplicando a função quantil normal a ambos os lados, obtemos . F n ( t n - 1 , α ) - F ( t n - 1 , α ) → 0 F ( t n - 1 , α ) → α t n - 1 , α → z αtn−1 Fn(tn−1,α)−F(tn−1,α)→0 F(tn−1,α)→α tn−1,α→zα
Portanto, implica para qualquer (em particular, ).t n - 1 , αtn−1,α→zα g(n)→∞g(n)=√tn−1,αg(n)→0 g(n)→∞ g(n)=n−−√
fonte
Prova geométrica
Vista geométrica
Considere a amostra observada como um ponto no espaço euclidiano n-dimensional e a estimativa da média como a projeção de uma observação na linha do modelo .x 1 = x 2 = . . . = x n = ˉ xx1, x2, . . . , xn x1= x2= . . . = xn= x¯
O escore t pode ser expresso como razão de duas distâncias neste espaço
Isso está relacionado à tangente do ângulo entre a observação e a linha na qual ela é projetada.
Equivalência distribuição t e distribuição angular
Nesta visão geométrica, a probabilidade do escore t ser maior que algum valor é equivalente à probabilidade do ângulo ser menor que algum valor:
Ou
Você poderia dizer que o escore t está relacionado ao ângulo da observação com a linha do modelo teórico. Para pontos fora do intervalo de confiança (então está mais longe de e o ângulo será menor), o ângulo estará abaixo de algum limite . Esse limite será alterado com mais observações. Se o limite desse ângulo for de 90 graus para o grande (a forma do cone fica mais plana, ou seja, menos pontuda e longa), isso significa que o tamanho do intervalo de confiança se torna menor e se aproxima. zero.ˉ x θ ν , α θ ν , α nμ x¯ θν, α θν, α n
Distribuição de ângulos como área relativa da tampa de uma n-esfera
Devido à simetria da distribuição de probabilidade conjunta de variáveis independentes distribuídas normais, todas as direções são igualmente prováveis e a probabilidade de o ângulo estar dentro de uma determinada região é igual à área relativa do limite de uma n-esfera.
A área relativa deste n-cap é encontrada integrando a área de um n-frustum :
onde é a função beta incompleta regularizada superior.Eux(⋅,⋅)
Limite de ângulo
Se for 90 graus para então será zero. n → ∞ t n - 1 , α / 2 / √θn,α n→∞ tn−1,α/2/n−−√
Ou uma afirmação inversa: para qualquer ângulo menor que 90 graus, a área relativa desse ângulo em uma esfera n diminui para zero quando vai para o infinito.n
Intuitivamente, isso significa que toda a área de uma n-esfera se concentra no equador à medida que a dimensão aumenta para o infinito.n
Quantitativamente, podemos mostrar isso usando a expressão
e considere a diferença entre e .L(n+2) L(n)
Em algum momento, a diminuição no denominador será assumido pela diminuição do numerador a função diminui para zero para para infinito.
fonte
Nós temos
o que implica que o segundo termo entre colchetes pode ter no máximo pois o máximo de pode ser . Observe que é o pdf da distribuição normal. Essa aproximação também é baseada nisso .12 α 1 φ ( x )
Portanto,
fonte