Intervalo de confiança estreito - maior precisão?

17

Eu tenho duas perguntas sobre intervalos de confiança:

Aparentemente, um intervalo de confiança estreito implica que há uma chance menor de obter uma observação dentro desse intervalo; portanto, nossa precisão é maior.

Também um intervalo de confiança de 95% é mais estreito que um intervalo de confiança de 99%, que é mais amplo.

O intervalo de confiança de 99% é mais preciso que os 95%.

Alguém pode dar uma explicação simples que possa me ajudar a entender essa diferença entre precisão e estreiteza?

acima
fonte
2
Eu acho que você quer dizer "há uma chance menor de obter uma observação fora desse intervalo". Infelizmente, um intervalo de confiança pode não significar o que parece, devido a problemas técnicos e estatísticos, mas, em geral, quanto menor o intervalo (em um determinado nível de confiança), menor a incerteza sobre os resultados. Há muitos tópicos neste site discutindo o que significa um intervalo de confiança (em oposição a, digamos, um intervalo de credibilidade). Nós não estamos sequer entrar em Predictive Intervalos ...
Wayne
@Wayne Por que a declaração não é "existe uma chance menor de obter uma observação dentro desse intervalo"? Como o intervalo estreito tem um erro grande do tipo 1, é mais provável que rejeite a hipótese nula verdadeira , ou seja, meu verdadeiro valor nulo não está contido nesse intervalo. Então, parece-me que a narrow confidence interval implies that there is a smaller chance of obtaining an observation within that intervalestá correto. Você poderia me explicar onde estou cometendo o erro?
31466

Respostas:

18

Os 95% não são numericamente ligados à confiança que você cobriu do verdadeiro efeito em sua experiência. Talvez reconhecer que "intervalo usando cálculo de intervalo de cobertura de 95%" possa ser um nome mais preciso para ele. Você pode optar por decidir que o intervalo contém o valor verdadeiro; e você estará certo se fizer isso consistentemente em 95% das vezes. Mas você realmente não sabe qual é a probabilidade de seu experimento específico sem mais informações.

T1: sua primeira consulta combina duas coisas e usa um termo incorretamente. Não é à toa que você está confuso. Um intervalo de confiança mais estreito pode ser mais preciso, mas, quando calculado da mesma maneira, como o método de 95%, todos têm a mesma precisão. Eles capturam o valor verdadeiro na mesma proporção do tempo.

Além disso, o fato de ser estreito não significa que você tem menos chances de encontrar uma amostra que se enquadre nesse intervalo de confiança estreito. Um intervalo de confiança estreito pode ser alcançado de três maneiras. O método experimental ou a natureza dos dados podem ter apenas uma variação muito baixa. O intervalo de confiança em torno do ponto de ebulição da água da torneira no nível do mar é bem pequeno, independentemente do tamanho da amostra. O intervalo de confiança em torno do peso médio das pessoas pode ser bastante grande porque as pessoas são muito variáveis, mas é possível diminuir esse intervalo de confiança apenas com a aquisição de mais observações. Nesse caso, à medida que você obtém mais certeza sobre onde está o verdadeiro valor, coletando mais amostras e diminuindo o intervalo de confiança, então a probabilidade de encontrar um indivíduo nesse intervalo de confiança diminui. (em qualquer caso, diminui quando você aumenta o tamanho da amostra, mas não se preocupe em coletar a grande amostra na caixa de água fervente). Por fim, pode ser restrito porque sua amostra não é representativa. Nesse caso, é mais provável que você tenha um dos 5% de intervalos que não contém o valor verdadeiro. É um pouco de paradoxo em relação à largura do IC e algo que você deve verificar conhecendo a literatura e quão variável esses dados normalmente são. Nesse caso, é mais provável que você tenha um dos 5% de intervalos que não contém o valor verdadeiro. É um pouco de paradoxo em relação à largura do IC e algo que você deve verificar conhecendo a literatura e quão variável esses dados normalmente são. Nesse caso, é mais provável que você tenha um dos 5% de intervalos que não contém o valor verdadeiro. É um pouco de paradoxo em relação à largura do IC e algo que você deve verificar conhecendo a literatura e quão variável esses dados normalmente são.

Além disso, considere que o intervalo de confiança é sobre tentar estimar o verdadeiro valor médio da população. Se você soubesse desse ponto, seria ainda mais preciso (e preciso) e nem teria uma série de estimativas. Mas sua probabilidade de encontrar uma observação com exatamente o mesmo valor seria muito menor do que encontrar uma em qualquer IC específico baseado em amostra.

Q2 : um intervalo de confiança de 99% é maior que 95%. Portanto, é mais provável que ele contenha o valor verdadeiro. Veja a distinção acima entre preciso e exato, você está confundindo os dois. Se eu tornar um intervalo de confiança mais estreito, com menor variabilidade e maior tamanho de amostra, ele se torna mais preciso, os valores prováveis ​​cobrem um intervalo menor. Se eu aumentar a cobertura usando um cálculo de 99%, ele se tornará mais preciso, é mais provável que o valor verdadeiro esteja dentro do intervalo.

John
fonte
2
A variabilidade da média (= o que você está tentando estimar) na população é zero.
Nick Sabbe
10

Para um determinado conjunto de dados, aumentar o nível de confiança de um intervalo de confiança resultará apenas em intervalos maiores (ou pelo menos não menores ). Não se trata de exatidão ou precisão, mas de quanto risco você está disposto a correr para perder o verdadeiro valor.

Se você estiver comparando intervalos de confiança para o mesmo tipo de parâmetro de vários conjuntos de dados e um for menor que o outro, pode-se dizer que o menor é mais preciso . Prefiro falar sobre precisão ao invés de precisão nessa situação (consulte este artigo relevante da Wikipedia ).

Karl
fonte
O que se entende por "mesmo tipo de parâmetro" e "vários conjuntos de dados"? Digamos, uma pesquisa sobre analfabetismo e a pesquisa é realizada em períodos diferentes, 1995, 1998, etc. Então, a "taxa de analfabetismo" é o mesmo tipo de parâmetro e os conjuntos de dados de 1995, 1998 etc. indicam vários conjuntos de dados?
precisa
Por exemplo, um conjunto de intervalos de confiança, cada um para a média de alguma população. Seu exemplo também se encaixa, eu acho.
314 Karl
3

Antes de tudo, um IC para uma determinada porcentagem de confiança (por exemplo, 95%) significa que, para todos os propósitos práticos (embora tecnicamente não esteja correto), você está confiante de que o verdadeiro valor está no intervalo.

Se esse intervalo for "estreito" (observe que isso só pode ser considerado de maneira relativa, portanto, para comparação com o que se segue, digamos que tenha 1 unidade de largura), significa que não há muito espaço para jogar: qualquer valor você escolhe nesse intervalo que será próximo do valor verdadeiro (porque o intervalo é estreito) e você tem certeza disso (95%).

Compare isso com um IC de 95% relativamente amplo (para corresponder ao exemplo anterior, digamos que tenha 100 unidades de largura): aqui, você ainda tem 95% de certeza de que o valor verdadeiro estará dentro desse intervalo, mas isso não indica muito muito, já que existem relativamente muitos valores no intervalo (cerca de um fator 100 em oposição a 1 - e peço, novamente, aos puristas que ignorem a simplificação).

Normalmente, você precisará de um intervalo maior quando quiser ter 99% de certeza de que o valor verdadeiro está nele, do que quando você precisa ter apenas 95% de certeza (nota: isso pode não ser verdadeiro se os intervalos não estiverem aninhados ), portanto, quanto mais confiança você precisar, maior será o intervalo que você precisará escolher.

Por outro lado, você está mais certo com o maior intervalo de confiança. Portanto, se eu lhe der 2 intervalos da mesma largura e disser que um é um IC de 95% e o outro é um de 99%, espero que você prefira o de 99%. Nesse sentido, 99% dos ICs são mais precisos: você tem menos dúvida de que terá perdido a verdade.

Nick Sabbe
fonte
obrigado! então quando eles dizem que essa nova pesquisa sobre neutrinos sendo mais rápida que a luz tem um intervalo de confiança muito pequeno (eu acho que isso significa estreito), isso significa que é mais provável que eles sejam precisos do que se fosse um intervalo de confiança amplo? (desconsiderando todos os outros aspectos)
28/09/11
10
Nick, sua primeira afirmação está errada. Não é um "problema técnico", apenas não está correto. O intervalo de confiança é uma afirmação sobre o que aconteceria em experimentos repetidos, de que eles cobririam o valor verdadeiro 95% do tempo. Uma afirmação sobre a confiança de que o verdadeiro valor está dentro do meu intervalo encontrado na minha experiência não é a mesma. Se você removesse o valor "que" em "que é confiante" e o valor numérico entre parênteses, estaria mais próximo da verdade. Você poderia apenas dizer que isso significa que você acredita que o verdadeiro valor provavelmente cairá no intervalo.
John
caso contrário, a resposta é muito bom ...
John
4
@ John: Evitei especificamente dizer que o intervalo em si é a variável aleatória, embora minha sentença não implique que não seja (admitidamente, isso sugere). Conheço os problemas envolvidos, mas os considero irrelevantes para a pergunta. Eu nunca vi uma situação prática em que a diferença também importasse, daí o "para todos os fins práticos".
Nick Sabbe
4
Não encontrou o problema? É como dizer o valor-p = a probabilidade do nulo e depois dizer que você nunca encontrou um problema com ele. Você não vai ficar nas revistas certas. É incorreto dizer que você tem 95% de certeza de que o valor verdadeiro está no seu intervalo atual. Tratar isso como uma questão esotérica significa que agora teremos (pelo menos) mais uma pessoa andando por aí dizendo: "Estou 95% confiante de que o valor está nessa faixa". Dificilmente mudaria sua resposta para corrigi-lo. Os outros problemas que você evita podem ser ignorados se você mudar essa declaração.
John
3

Estou adicionando aqui algumas boas respostas às quais dei votos positivos. Eu acho que há um pouco mais que deve ser dito para esclarecer completamente a conclusão. Gosto dos termos precisos e corretos, conforme Efron os define. Fiz uma longa discussão sobre isso muito recentemente, sobre uma questão diferente. Whuber moderado realmente gostou dessa resposta. Não irei ao mesmo passo para repetir isso aqui. No entanto, para a Efron, a precisão está relacionada ao nível de confiança e à correção da largura ou do aperto do intervalo. Mas você não pode falar sobre tensão sem considerar primeiro a precisão. Alguns intervalos de confiança são exatos e precisos, porque eles têm a cobertura real que anunciam. Um intervalo de confiança de 95% também pode ser aproximado porque utiliza uma distribuição assintótica. Os intervalos aproximados baseados em assintóticos são para um tamanho de amostra finito e não terão a cobertura anunciada, que é a cobertura que você obteria se a distribuição assintótica fosse a distribuição exata. Portanto, um intervalo aproximado pode ser coberto (ou seja, anunciar 95% quando a cobertura real é de apenas 91%) ou, na rara, mas menos séria cobertura de casos (ou seja, a cobertura anunciada é de 95%, mas é real em 98%). No primeiro caso, nos preocupamos com a proximidade entre a cobertura real e a cobertura anunciada. Uma medida de proximidade é a ordem de precisão que pode ser 1 / √n ou 1 / n. Se o nível de confiança real estiver próximo, chamamos de preciso. A precisão é importante com intervalos de confiança de autoinicialização que nunca são exatos, mas algumas variantes são mais precisas que outras.

Essa definição de precisão pode ser diferente daquela a que o OP está se referindo, mas deve ficar claro agora qual é a definição de Efron e por que é importante ser preciso. Agora, se você tem dois métodos exatos, podemos preferir um sobre o outro, se para qualquer nível de confiança ele tiver a menor largura esperada. Um intervalo de confiança que seja melhor nesse sentido (às vezes chamado de mais curto) seria o escolhido. Mas isso exigia exatidão. Se o nível de confiança for apenas aproximado, poderíamos comparar maçãs e laranjas. Um poderia ser mais estreito que outro, apenas porque é menos preciso e, portanto, possui uma cobertura real menor do que a cobertura anunciada.

Se dois intervalos de confiança são muito precisos ou um é exato e o outro muito preciso na comparação da largura esperada pode ser bom, porque pelo menos agora estamos vendo apenas duas duas variedades de maçãs.

Michael R. Chernick
fonte