Como as margens de erro estão relacionadas aos intervalos de confiança?

11

Alguém pode me dizer a diferença entre margens de erro e intervalos de confiança? Na Internet, vejo esses dois significados sendo usados ​​de forma intercambiável.

É certo dizer,

"Intervalos de confiança são mostrados como 1,96 e exibidos nos gráficos como margens de erro"?

Mintuz
fonte
1
Discussões úteis sobre esse tópico podem ser encontradas pesquisando em nosso site .
whuber

Respostas:

13

A Internet está cheia de lixo, como todos sabemos. Ajuda a encontrar fontes autorizadas e a se concentrar nelas para ajudar a resolver esses problemas. Um panfleto publicado pela American Statistical Association (atribuído a Fritz Scheuren e "completamente atualizado por volta de 1997") define a margem de erro como um intervalo de confiança de 95% (p. 64, à direita).

À luz disso, é surpreendente que o artigo da Wikipedia sobre margem de erro use uma definição diferente, embora faça referência a este panfleto! A Wikipedia escreve,

A margem de erro é geralmente definida como o "raio" (ou metade da largura) de um intervalo de confiança para uma estatística específica de uma pesquisa. ... Quando uma margem de erro global única é relatada para uma pesquisa, ela se refere à margem de erro máxima para todas as porcentagens relatadas usando a amostra completa da pesquisa.

Em outras palavras, para a Wikipedia, o MoE tem metade da largura máxima de um conjunto de intervalos de confiança (que podem ter coberturas diferentes de 95%).

Discutimos essa confusão (ou, pelo menos, falta de padronização) em comentários em outras partes deste site. Nossa conclusão foi que você precisa esclarecer o que quer dizer com "margem de erro" sempre que usar esse termo.

whuber
fonte
7

Não existe uma convenção universalmente seguida sobre o que é uma "margem de erro", mas acho que (como você observou) é mais frequentemente usada como significando o raio de um intervalo de confiança , na escala original da estimativa ou como porcentagem de uma estimativa. Às vezes, é usado como sinônimo do "erro padrão"; portanto, você precisa ter cuidado para que outras pessoas entendam o que você quer dizer quando o usa.

A "intervalo de confiança" não têm convenção universal sobre o seu significado. É basicamente o intervalo de estimativas possíveis geradas por um processo de estimativa que, X% do tempo (95% é o mais comumente usado) conteria o valor real do parâmetro que está sendo estimado. Esse conceito de "processo" que produziria o valor verdadeiro X% do tempo é um pouco contra-intuitivo e não deve ser confundido com um "intervalo de credibilidade" da inferência bayesiana, que tem uma definição muito mais intuitiva, mas é não é a mesma coisa que o intervalo de confiança amplamente utilizado.

Sua cotação real é um pouco confusa e precisa de algumas correções menores, conforme descrito. Eu evitaria esse uso adicional da palavra "margem" e favoreceria "barras de erro". Assim:

"Os intervalos de confiança são estimados em 1,96 multiplicados pelos erros padrão relevantes e mostrados nos gráficos como barras de erro."

(Isso deixa de lado a questão de saber se essa é uma boa maneira de calcular intervalos de confiança, que depende do seu modelo etc. e não é relevante).

Comentário final sobre terminologia - não gosto de "erro padrão", que significa apenas "o desvio padrão da estimativa"; ou "erro de amostragem" em geral - prefiro pensar em termos de aleatoriedade e variação das estatísticas, em vez de "erros". Mas passei a usar o termo "erro padrão" acima porque acho que é tão amplamente usado.

Peter Ellis
fonte