O SPSS fornece a saída "intervalo de confiança da diferença". Li em alguns lugares que significa "95 vezes em 100, nossa diferença média amostral estará entre esses limites". Acho isso pouco claro. Alguém pode sugerir uma redação mais clara para explicar "intervalo de confiança da diferença de médias"? Essa saída aparece no contexto de um teste t de uma amostra.
confidence-interval
Anne
fonte
fonte
Respostas:
Isso não é algo fácil, mesmo para estatísticos respeitados. Veja uma recente tentativa de Nate Silver :
(do blog FiveThirtyEight no New York Times, 29/9/10). Esse não é um intervalo de confiança. Dependendo de como você o interpreta, é um intervalo de tolerância ou um intervalo de previsão. (Caso contrário, não há nada com a excelente discussão de Silver sobre estimativa de probabilidades; é uma boa leitura.) Muitos outros sites (principalmente aqueles com foco em investimentos) confundem de maneira semelhante os intervalos de confiança com outros tipos de intervalos.
O New York Times fez um esforço para esclarecer o significado dos resultados estatísticos que produz e relata. A boa impressão abaixo de muitas pesquisas inclui algo como isto:
( por exemplo , Como a pesquisa foi conduzida , 2/5/2011.)
Um pouco prolixo, talvez, mas claro e preciso: essa afirmação caracteriza a variabilidade da distribuição amostral dos resultados da pesquisa. Isso está chegando perto da ideia do intervalo de confiança, mas não está lá. Pode-se considerar o uso de tais palavras no lugar de intervalos de confiança em muitos casos, no entanto.
Quando há tanta confusão potencial na Internet, é útil recorrer a fontes autorizadas. Um dos meus favoritos é o texto consagrado pelo tempo de Freedman, Pisani, & Purves, Statistics. Agora em sua quarta edição, é usado nas universidades há mais de 30 anos e é notável por suas explicações claras e claras e foco nos métodos "freqüentadores" clássicos. Vamos ver o que diz sobre a interpretação dos intervalos de confiança:
[na p. 384; todas as citações são da terceira edição (1998)]. Continua,
[p. 384] O texto diz muito mais sobre os intervalos de confiança, mas isso é suficiente para ajudar: sua abordagem é mover o foco da discussão para a amostra, trazendo ao mesmo tempo rigor e clareza às declarações. Portanto, podemos tentar a mesma coisa em nossos próprios relatórios. Por exemplo, vamos aplicar essa abordagem para descrever um intervalo de confiança de [34%, 40%] em torno de uma diferença percentual relatada em um experimento hipotético:
(Este é o meu texto, que certamente pode ser aprimorado: convido editores a trabalharem nele.)
Uma declaração longa como essa é um tanto difícil de manejar. Nos relatórios reais, a maior parte do contexto - amostragem aleatória, assuntos e controles, possibilidade de variabilidade - já foi estabelecida, tornando desnecessária metade da declaração anterior. Quando o relatório estabelece que existe variabilidade da amostra e exibe um modelo de probabilidade para os resultados da amostra, geralmente não é difícil explicar um intervalo de confiança (ou outro intervalo aleatório) de maneira clara e rigorosa, conforme o público precisa.
fonte
Do ponto de vista técnico pedante, eu pessoalmente não acho que exista uma "redação clara" da interpretação dos intervalos de confiança.
Eu interpretaria um intervalo de confiança como: existe uma probabilidade de 95% de que o intervalo de confiança de 95% cubra a verdadeira diferença média
Uma interpretação disso é queN N
Mas note que tudo isso está na filosofia. É melhor deixar intervalos de confiança vagos na explicação que penso. Eles dão bons resultados quando usados adequadamente.
fonte
A resposta aproximada para a pergunta é que um intervalo de confiança de 95% permite que você tenha 95% de confiança de que o verdadeiro valor do parâmetro está dentro do intervalo. No entanto, essa resposta aproximada é incompleta e imprecisa.
A incompletude está no fato de que não está claro que "95% confiante" significa algo concreto, ou, se o fizer, então esse significado concreto não seria universalmente aceito, mesmo por uma pequena amostra de estatísticos. O significado da confiança depende de qual método foi usado para obter o intervalo e de qual modelo de inferência está sendo usado (o que, espero, ficará mais claro abaixo).
A imprecisão reside no fato de que muitos intervalos de confiança não são projetados para informar qualquer coisa sobre a localização do valor verdadeiro do parâmetro para o caso experimental específico que produziu o intervalo de confiança! Isso será surpreendente para muitos, mas decorre diretamente da filosofia de Neyman-Pearson, que é claramente declarada nesta citação de seu artigo de 1933 "Sobre o problema dos testes mais eficientes das hipóteses estatísticas":
Intervalos baseados na 'inversão' dos testes de hipóteses NP herdarão, portanto, desse teste a natureza de ter conhecido propriedades de erro de longo prazo sem permitir inferência sobre as propriedades do experimento que as produziu! Meu entendimento é que isso protege contra inferência indutiva, que Neyman aparentemente considerou uma abominação.
Neyman reivindica explicitamente o termo 'intervalo de confiança' e a origem da teoria dos intervalos de confiança em seu artigo de 1941 da Biometrika “Argumento fiducial e a teoria dos intervalos de confiança”. De certo modo, qualquer coisa que seja adequadamente um intervalo de confiança é reproduzida por suas regras e, portanto, o significado de um intervalo individual só pode ser expresso em termos da taxa de longo prazo em que os intervalos calculados por esse método contêm (encobrem) o verdadeiro valor relevante. valor do parâmetro.
Agora precisamos forçar a discussão. Uma vertente segue a noção de 'cobertura' e a outra segue intervalos não neymanianos que são como intervalos de confiança. Adiarei o primeiro para que eu possa concluir este post antes que ele se torne muito longo.
Existem muitas abordagens diferentes que produzem intervalos que poderiam ser chamados de intervalos de confiança não Neymanianos. O primeiro deles são os intervalos fiduciais de Fisher. (A palavra 'fiducial' pode assustar muitos e provocar sorrisos irônicos de outros, mas deixarei isso de lado ...) Para alguns tipos de dados (por exemplo, normal, com variação desconhecida da população), os intervalos calculados pelo método de Fisher são numericamente idênticos aos intervalos que seriam calculados pelo método de Neyman. No entanto, eles convidam interpretações diametralmente opostas. Os intervalos neymanianos refletem apenas as propriedades de cobertura de longo prazo do método, enquanto os intervalos de Fisher visam apoiar a inferência indutiva a respeito dos verdadeiros valores dos parâmetros para o experimento específico que foi realizado.
O fato de que um conjunto de limites de intervalo pode vir de métodos baseados em dois paradigmas filosoficamente distintos leva a uma situação realmente confusa - os resultados podem ser interpretados de duas maneiras contraditórias. A partir do argumento fiducial, há uma probabilidade de 95% de que um intervalo fiducial específico de 95% contenha o valor verdadeiro do parâmetro. Pelo método de Neyman, sabemos apenas que 95% dos intervalos calculados dessa maneira conterão o valor verdadeiro do parâmetro e devemos dizer coisas confusas sobre a probabilidade do intervalo que contém o valor verdadeiro do parâmetro ser desconhecido, mas 1 ou 0.
Em grande medida, a abordagem de Neyman dominou a de Fisher. Isso é muito infeliz, na minha opinião, porque não leva a uma interpretação natural dos intervalos. (Releia a citação acima de Neyman e Pearson e verifique se ela corresponde à sua interpretação natural dos resultados experimentais. Provavelmente não.)
Se um intervalo pode ser corretamente interpretado em termos de taxas de erro globais, mas também corretamente em termos inferenciais locais, não vejo uma boa razão para barrar os usuários de intervalo da interpretação mais natural oferecida por este último. Assim, minha sugestão é que a interpretação adequada de um intervalo de confiança seja AMBAS as seguintes:
Neymanian: Esse intervalo de 95% foi construído por um método que gera intervalos que cobrem o valor verdadeiro do parâmetro em 95% das ocasiões a longo prazo (... da nossa experiência estatística).
Pescador: Este intervalo de 95% tem uma probabilidade de 95% de cobrir o valor real do parâmetro.
(Os métodos bayesiano e de probabilidade também produzirão intervalos com propriedades freqüentistas desejáveis. Tais intervalos convidam interpretações ligeiramente diferentes que provavelmente se sentirão mais naturais do que as Neymanianas.)
fonte
O significado de um intervalo de confiança é: se você repetisse seu experimento exatamente da mesma maneira (ou seja: o mesmo número de observações, com base na mesma população etc.), e se suas suposições estiverem corretas, você calcularia esse intervalo novamente em cada repetição, esse intervalo de confiança conteria a prevalência verdadeira em 95% das repetições (em média).
Portanto, você pode dizer que tem 95% de certeza (se suas suposições estão corretas etc.) que agora construiu um intervalo que contém a verdadeira prevalência.
Isso geralmente é afirmado como: com 95% de confiança, entre 4,5 e 8,3% dos filhos de mães que fumaram durante a gravidez se tornam obesos.
Observe que isso normalmente não é interessante por si só: você provavelmente deseja comparar isso com a prevalência em filhos de mães que não fumaram (razão de chances, risco relativo etc.)
fonte
Se a verdadeira diferença média estiver fora desse intervalo, haverá apenas 5% de chance de que a diferença média de nosso experimento esteja tão distante da verdadeira diferença média.
fonte
Minha interpretação: se você realizar o experimento N vezes (onde N tende ao infinito), fora desse grande número de experimentos, 95% dos experimentos terão intervalos de confiança que se situam dentro desses limites de 95%. Mais claramente, digamos que esses limites são "a" e "b", então 95 em 100 vezes a diferença média da amostra ficará entre "a" e "b". Suponho que você entenda que experimentos diferentes podem ter amostras diferentes para cobrir fora de toda a população.
fonte
"95 vezes em 100, seu valor ficará dentro de um desvio padrão da média"
fonte