Esta é uma pergunta muito básica. Por que usamos uma distribuição chi square? Qual o significado dessa distribuição? Por que essa distribuição é usada para criar um intervalo de confiança para a variação?
Todos os lugares em que procuro uma explicação no Google apenas apresentam esse fato, explicando quando usar o chi, mas não explicando por que usar o chi e por que ela tem a mesma aparência.
Muito obrigado a qualquer um que possa me indicar a direção certa e que seja - realmente entendendo por que estou usando o chi quando estou criando um intervalo de confiança para a variação.
variance
chi-squared
nafrtiti
fonte
fonte
Respostas:
Resposta rápida
O motivo é que, assumindo que os dados são iid e e definindo ˉ XXi∼N(μ,σ2)
ao formar intervalos de confiança, a distribuição da amostra associada à variância da amostra (S2, lembre-se, uma variável aleatória!) É uma distribuição qui-quadrado (S2(N-1)/σ2∼χ2n-1), assim como a distribuição da amostra associada à média da amostra é uma distribuição normal padrão ((ˉX-μ)√
Resposta longa
Primeiramente, provaremos que segue uma distribuição qui-quadrado com N - 1S2(N−1)/σ2 N−1 graus de liberdade. Depois disso, veremos como essa prova é útil ao derivar os intervalos de confiança para a variação e como a distribuição do qui-quadrado aparece (e por que é tão útil!). Vamos começar.
A prova
Para isso, talvez você precise se acostumar com a distribuição do qui-quadrado neste artigo da Wikipedia . Essa distribuição possui apenas um parâmetro: os graus de liberdade, , e passa a ter uma Função Geradora de Momento (MGF) dada por: m χ 2 ν ( t ) = ( 1 - 2 t ) - ν / 2 . Se pudermos mostrar que a distribuição de S 2 ( N - 1 ) / σ 2 tem uma função geradora de momentos como esta, mas com ν Nν
Se definirmos, ondeZi~N(0,1), isto é, variáveis aleatória normal, a função de geração de momento deYé dada por m Y (t)
With the above facts, note that if you multiply the sample variance byN−1 , you obtain (after some algebra),
Calculating the Confidence Interval for the variance.
When looking for a confidence interval for the variance, you want to know the limitsL1 and L2 in
fonte