Diferença entre viés, viés sistemático e erro sistemático?

9

Existe alguma diferença entre os seguintes termos ou são iguais?

  1. Viés
  2. Viés sistemático
  3. Erros sistemáticos

Se houver algumas diferenças, por favor, explique-as. Esses erros podem ser reduzidos quando se aumenta o tamanho da amostra?

UPDATE: Meu campo de interesse é inferência estatística. Quero dizer que como diferenciamos esses termos como estatístico.

Biostat
fonte
1
Seria útil indicar em qual campo de estudo você está interessado. Fica claro pelas respostas já oferecidas, por exemplo, que "viés" possui significados especializados que diferem dos da análise estatística (na teoria da estimativa, o viés é a diferença entre a expectativa de um estimador e o valor de seu estimador). Sua pergunta agora está marcada com "epidemiologia" porque as respostas atualmente são desse campo, mas isso pode ou não ser o que realmente interessa.
whuber
1
Pelo que entendi, no viés estatístico é a diferença entre estimador e estimador , enquanto na epidemiologia, viés é a diferença não aleatória entre estimador e estimador . Quando vejo termos como 'viés' e 'erro sistemático' no contexto da bioestatística, costumo pensar na interpretação epidemiológica. Mas, novamente, como estudante de epidemiologia, sou tendenciosa. Este conjunto de slides da Sander Greenland aborda os dois conceitos, mas se concentra na epidemiologia.
jthetzel

Respostas:

13

O termo "viés" aparece de duas maneiras na literatura fundamental sobre estatística:

  1. "... o viés Eθ[δ(X)]-g(θ), às vezes chamado de erro sistemático, ... "[EL Lehmann, Teoria da estimativa de pontos, 1983. Este é um texto clássico.] Na notação de Lehmann, que é padrão,Eθ é a expectativa quando a distribuição é dada pelo parâmetro θ, δ é um estimador, X é uma observação e g(θ)é uma propriedade da distribuição a ser estimada (a estimativa). Em outras palavras, a observação (ou sequência da mesma) é uma variável aleatória, o que torna a estimativa aleatória, e o viés é o desvio esperado entre a estimativa e a estimativa. Depende da distribuição (desconhecida, mas verdadeira)θ, tornando-o uma função da verdadeira distribuição. Lehmann dedica um capítulo inteiro a estimadores imparciais: aqueles com viés zero, independentemente do valor deθ.

  2. Na teoria das medidas, "viés" (ou "erro sistemático" ) é uma diferença entre a expectativa de uma medida e o verdadeiro valor subjacente. A polarização pode resultar de erros de calibração ou desvio instrumental, por exemplo. Compare esse uso com o anterior: aqui, um viés é uma propriedade de uma medida, que é um processo físico, enquanto antes era uma propriedade de um estimador estatístico (que é um procedimento matematicamente definido para fazer suposições a partir dos dados).

O "viés sistemático" parece ser usado apenas ao distinguir o viés do "erro" aleatório: o termo "erro" tende a ser usado principalmente para termos aleatórios com expectativa zero.

Em muitos casos, o viés no primeiro sentido diminui à medida que a quantidade de dados aumenta: muitos estimadores tendenciosos na prática se tornam cada vez menos tendenciosos com mais dados (embora isso não seja teoricamente garantido, porque o conceito de viés é muito amplo). Um bom exemplo é o estimador de probabilidade máxima da variação de uma distribuição quandon sorteios independentes xEudessa distribuição estão disponíveis. O estimador de ML é

v^=1nEu=1n(xEu-x¯)2,

para x¯=1nEu=1nxEu. É sabido que isso é tendencioso; o estimadornn-1v^é imparcial. De onde, comon, v^nn-1v^torna-se assintoticamente imparcial.

O viés no contexto da medição (o segundo sentido), no entanto, geralmente não é redutível com a realização de mais medições: o viés é inerente ao próprio procedimento de medição. É preciso estimar e reduzir o viés calibrando o procedimento de medição ou comparando-o com outros procedimentos conhecidos por não ter (ou menos) viés, estimando o viés e compensando isso.

Esta breve descrição da terminologia usada para inferência estatística não suplanta as respostas estendidas e mais especializadas já publicadas. Em vez disso, pretende servir como uma introdução a eles e como um aviso moderado para desconfiar de generalizações universais feitas em contextos limitados, como "todos os três [termos] são equivalentes a 'erro sistemático'", o que claramente pode estar correto apenas em sentido estrito, porque as duas definições que citei não são equivalentes. A leitura das outras respostas me alertou para a possibilidade de que a literatura em campos especializados como epidemiologia possa estar usando termos estatísticos padrão familiares como "viés" de maneiras inesperadas, algumas das quais podem realmente contradizer as definições estatísticas. No final,

whuber
fonte
1
Obrigado por um post interessante. Eu suspeito que muitos epidemiologistas termos "emprestar" a partir estatísticos, adaptá-las ao seu ambiente e, em seguida, ... devido à falta de uma base de som ... torna-se um pouco de uma confusão
Max Gordon
@ Max Gordon: whuber fornece uma ótima resposta. Talvez outros campos não tenham emprestado termos aleatórios de estatísticas matemáticas, mas tenham definido termos para se adequarem aos objetivos do campo. Independentemente disso, é útil aos estatísticos, epidemiologistas e outros estarem cientes dessas diferenças sutis, porém significativas, na terminologia, especialmente devido à prevalência de esforços colaborativos interdisciplinares.
Jtetzel #
+1 ótima resposta! Muito claro, e ainda rigoroso e conciso.
gung - Restabelece Monica
@jthtzel, as estatísticas matemáticas não precisam ser interpretadas como algo que tem vários significados. É uma ciência conduzida por aplicativos, implicando que ele cuida de problemas associados à medição (estatística) e verdade, isto é, matemática. A partir de agora, a literatura sugere que o erro de medição se comporta aleatoriamente e, portanto, uma estatística (média e variância) permanece inalterada. E, no caso de uma média, o chamado viés constante pode causar um valor acima ou abaixo do valor real. Porém, a variação e o SD permanecem inalterados.
Subhash C. Davar
4

Se eu aprendi alguma coisa através dos meus estudos epidemiológicos é que este é um campo minado onde não há verdadeiro certo ou errado. Eu gosto de estatística, porque pelo menos tem um fundamento em matemática, enquanto epidemiologia é mais opinião. Dito isto, tentarei responder sua pergunta.

De M. Porta Um Dicionário de Epidemiologia 5a ed. não há menção de viés sistemático e erro sistemático diz "Veja BIAS". Isso deixa o viés descrito como: “Desvio sistemático dos resultados ou inferências da verdade. ... levando a resultados ou conclusões que são sistematicamente (opostas a aleatoriamente) diferentes da verdade. ” Eu diria que não há viés sistemático, pois todos eles desviam seus resultados da estimativa de risco real. A coisa mais importante sobre o viés é que você não pode reduzi-lo aumentando o tamanho da amostra .

Existem muitos tipos de viés, ouvi dizer que um dos artigos originais sobre viés continha mais de 300 tipos diferentes. O importante é identificá-los antes de iniciar o estudo e, em seguida, tentar configurar seu estudo / experiência para evitar distorções. Em estudos epidemiológicos, é muito útil separar o viés em três categorias:

  • Viés de seleção
  • Viés de informação
  • Confundindo

Viés de seleção é quando você seleciona o tipo errado de pessoa para o seu estudo. Digamos que você esteja interessado em ver se trabalhar em uma mina de carvão é um risco - se você procurar os indivíduos do seu estudo na mina de carvão, poderá descobrir que eles são mais saudáveis ​​do que a população em geral, apenas pelo fato de que aqueles que são doentes não estão mais trabalhando na mina de carvão, ou seja, você seleciona os indivíduos mais saudáveis ​​e não estuda mais a população de origem, mas uma subamostra. O viés de seleção geralmente é o tipo de viés mais maligno, porque é muito difícil de identificar.

Viés de informação é quando sua coleta de dados sobre resultado ou exposição está com defeito. Um erro comum é o cirurgião que pergunta ao paciente se ele está melhor após a cirurgia. Aqui, o paciente pode não querer decepcionar o cirurgião e relatar um resultado melhor do que ele / ela faria e o cirurgião pode não querer admitir que a cirurgia foi um fracasso, relato e viés do entrevistador.

O viés de informação também é conhecido como viés de observação. Quando se trata de um erro em uma variável contínua, é um erro de medição, enquanto na configuração da classificação você tem um viés de classificação incorreta. Classificação incorreta significa que um indivíduo do estudo pode terminar na categoria errada; um fumante pode ser classificado como não-fumante por acaso ou enviando um viés. Mesmo que a classificação incorreta seja por acaso (classificação não diferencial), ela ainda tenderá a subestimar o risco de maneira sistemática, especialmente quando você tiver poucas categorias. Embora um excelente estudo de Jurek et al. 2005 mostrou que você deve tomar cuidado ao fazer essa suposição com base em um único estudo. Em relação à sua pergunta, posso imaginar que esse é o “viés não sistemático” que o viés sistemático relaciona.

Confundir é um fator associado à exposição e ao resultado e que se relaciona mais com o indivíduo do estudo. Por exemplo, Lambe et al. 2006 mostrou que fumar durante a gravidez aumenta o risco de baixo desempenho escolar, mas quando se olha para irmãos em uma subpopulação em que a mãe parou de fumar durante a segunda gravidez, o desempenho escolar também é ruim. Isso sugere que o fumo não é a causa do mau desempenho escolar, mas talvez um fator de confusão para outros fatores sociais.

Este artigo de Sica et al. 2006 entra em mais detalhes. O que você precisa estar preparado é que realmente existe uma falta de consenso em campo quanto à terminologia. Meu sonho é que a OMS um dia produza uma lista de definições fáceis de entender, faça sentido intuitivo e onde o debate finalmente poderá terminar.

Max Gordon
fonte
Se você disser que o viés nunca diminui, como justificaria essa definição? "Um estimador assintoticamente imparcial é um estimador imparcial, pois o tamanho da amostra tende ao infinito."
Biostat
Eu concordo com @jthetzel, não tenho certeza se entendi bem sua pergunta. Uma estimativa imparcial é aquela em que não há viés e em que você pode confiar no tamanho da amostra, recuar e deixar que as estatísticas façam o trabalho (... e sim, provavelmente nunca ocorre na realidade, onde você sempre tem algum tipo de viés ) Eu tento simplificar: o viés é para mim sempre um erro sistemático, mas como eu disse - existem muitos livros sobre esse assunto e, infelizmente, muitos são escritos por pessoas que mal conseguem entender as estatísticas. Pergunte a um epidemiologista sobre modificação de efeito - muitos (a maioria?) Pensar nisso como uma espécie de magia ...
Max Gordon
4

As terminologias podem variar de campo para campo. No entanto, usando os termos definidos nos comentários abaixo:

Existe alguma diferença entre os seguintes termos ou são iguais?

Não, todos os três são equivalentes a 'erro sistemático'.

Esses erros podem ser reduzidos quando se aumenta o tamanho da amostra?

Não, o aumento do tamanho da amostra reduz o erro aleatório, não o erro sistemático.

Comente

Esses termos são retirados do campo da epidemiologia, especificamente da discussão de Rothman e colegas sobre o erro nos capítulos 9 e 10 da Epidemiologia Moderna .

Para resumir:

O objetivo de um investigador é fornecer uma estimativa precisa de alguma medida (por exemplo, média, risco relativo, taxa de risco etc.) dentro de uma população. Uma estimativa precisa é válida e precisa . Uma estimativa válida terá uma estimativa pontual (por exemplo, média, risco relativo, taxa de risco etc.) que se aproxima do valor real na população. Uma estimativa precisa terá níveis de confiança estreitos em torno da estimativa pontual. Além disso, uma estimativa pode ser válida internamente, em relação à população estudada, e externamente válida, em relação a uma população generalizada.

Os desvios da precisão são causados ​​por erro . Existem dois tipos principais de erro: erro sistêmico e erro aleatório .

O erro sistêmico, geralmente chamado de viés, resulta em estimativas que não são válidas. O erro sistêmico inclui erro devido a confusão, viés de seleção e viés de informações. Geralmente, a confusão pode ser corrigida com técnicas como estratificação ou regressão. Tradicionalmente, o viés de seleção e informação é ignorado ou apenas avaliado qualitativamente nas análises, provavelmente devido ao desconhecimento das análises de viés apropriadas. No entanto, existem metodologias para análise de viés qunatitativo (por exemplo, Lash TL e AK Fink (2003) ).

O erro aleatório resulta em estimativas não precisas. O erro aleatório inclui erro de amostragem e erro de medição aleatório, entre outros. Os métodos para aumentar a precisão incluem aumentar o tamanho do estudo, aumentar a eficiência do estudo e análises estatísticas de otimização da precisão, como agrupamento e regressão.

Atualizar

Para ilustrar por que o aumento do tamanho da amostra não diminui o erro sistemático com a analogia do alvo (copiada desta publicação do CV ):

Analogia do alvo

Não importa quantos dardos sejam lançados no tabuleiro, a estimativa pontual não mudará para o verdadeiro alvo quando houver um 'alto viés'. Aqui 'viés' é equivalente a 'erro sistemático' e 'variação' é equivalente a 'erro aleatório'.

jthetzel
fonte
Se você disser que o viés nunca diminui, como justificaria essa definição? "Um estimador assintoticamente imparcial é um estimador imparcial, pois o tamanho da amostra tende ao infinito."
Biostat
@biostat: um estimador imparcial não contém erros sistemáticos, mas pode conter erros aleatórios. Assim, à medida que o tamanho da amostra aumenta, a variância diminui e o estimador converge para o valor real do parâmetro na população. Um estimador tendencioso conteria erro sistemático e não convergiria para o valor real do parâmetro na população (a menos que vários vieses no estimador se cancelassem).
Jtetzel #
@biostat: Talvez outra maneira de pensar sobre isso: 1) A distribuição de probabilidade de um estimador assintoticamente tendencioso pode incluir o valor verdadeiro em pequenas amostras, entre outros valores, mas convergirá para um valor diferente do valor real, pois o tamanho da amostra tende ao infinito . 2) A distribuição de probabilidade de um estimador assintoticamente imparcial pode incluir o valor verdadeiro em amostras pequenas, entre outros valores, mas convergirá para o valor verdadeiro, pois o tamanho da amostra tende ao infinito.
Jtetzel #
Viés e erro sistemático não são os mesmos? porque aqui o viés pode ter erro aleatório como você disse? O que você pensaria?
Biostat 25/11
@biostat: Como mencionado acima, as terminologias podem variar de campo para campo. Eu defini viés como erro sistemático. Você parece estar definindo um viés como erro. Na epidemiologia, o viés é um erro sistemático, pelo menos para aqueles que seguem a terminologia do livro canônico de Rothman. Talvez você possa adicionar contexto à sua pergunta original para orientar as respostas na direção apropriada.
Jtetzel #
1

Esses trechos em power point têm algumas informações para complementar o que jthetzel e Max Gordon deram. Eles são orientados para dados de pesquisa e não são rigorosos ou formais, mas se você quisesse esse tipo de resposta, provavelmente procuraria em livros didáticos sobre teoria de medição ou métodos de pesquisa.

rolando2
fonte
2
Enquanto estamos nisso, aqui está outro conjunto de slides da Groenlândia.
jthetzel