Significado real da elipse de confiança

12

Lendo sobre o verdadeiro significado da elipse de 95% de confiança, costumo encontrar duas explicações:

  1. A elipse que contém 95% dos dados
  2. Não é o acima, mas a elipse que explica a variação dos dados. Não sei se entendi direito, mas eles parecem significar que, se um novo ponto de dados chegar, há 95% de chance de a nova variação permanecer na elipse.

Você pode lançar alguma luz?

Kenny
fonte

Respostas:

15

Na verdade, nenhuma explicação está correta.

Uma elipse de confiança tem a ver com parâmetros populacionais não observados , como a verdadeira média populacional da sua distribuição bivariada. Uma elipse de confiança de 95% para essa média é realmente um algoritmo com a seguinte propriedade: se você replicasse sua amostragem da distribuição subjacente muitas vezes e calculasse uma elipse de confiança cada vez, 95% das elipses assim construídas conteriam a subjacente significar. (Observe que cada amostra obviamente produziria uma elipse diferente.)

Assim, uma elipse de confiança geralmente não contém 95% das observações. De fato, à medida que o número de observações aumenta, a média geralmente será cada vez melhor estimada, levando a elipses de confiança cada vez menores, que por sua vez contêm uma proporção cada vez menor dos dados reais. (Infelizmente, algumas pessoas calculam a menor elipse que contém 95% de seus dados, remanescente de um quantil, o que por si só é bastante bom ... mas, em seguida, chamam essa "elipse quantil" de "elipse de confiança", que, como você vê, leva à confusão.)

A variação da população subjacente está relacionada à elipse de confiança. Uma alta variação significa que os dados estão em todo o lugar, portanto a média não é bem estimada, portanto a elipse de confiança será maior do que se a variação fosse menor.

Obviamente, também podemos calcular elipses de confiança para qualquer outro parâmetro populacional que desejemos estimar. Ou podemos observar outras regiões de confiança além das elipses, especialmente se não soubermos que o parâmetro estimado é (assintoticamente) normalmente distribuído.

O análogo unidimensional da elipse de confiança é o e a navegação pelas perguntas anteriores nesta tag é útil. Nossa atual pergunta mais votada nesta tag é particularmente interessante: por que um IC de 95% não implica uma chance de 95% de conter a média? A maior parte da discussão é válida também para análogos dimensionais mais altos do intervalo de confiança unidimensional.

Stephan Kolassa
fonte
1

Depende da área a que esse conceito se aplica. O que foi dito acima é verdadeiro para as estatísticas, mas quando aplicamos estatísticas a outros assuntos, as coisas são um pouco diferentes. Na biomecânica, por exemplo, usamos o termo elipse de confiança (embora exista um debate se deve ser elipse de previsão) como uma técnica para medir o centro do deslocamento da pressão quando um sujeito está em uma plataforma de força. Em seguida, a elipse desenhada em torno dos dois eixos (maior e menor) deve conter 95% dos pontos de dados que representam o centro do deslocamento da pressão ao longo do tempo de um teste.

Cathrine Katsigianni
fonte