Existe alguma diferença entre os seguintes termos ou são iguais?
- Viés
- Viés sistemático
- Erros sistemáticos
Se houver algumas diferenças, por favor, explique-as. Esses erros podem ser reduzidos quando se aumenta o tamanho da amostra?
UPDATE: Meu campo de interesse é inferência estatística. Quero dizer que como diferenciamos esses termos como estatístico.
measurement-error
bias
Biostat
fonte
fonte
Respostas:
O termo "viés" aparece de duas maneiras na literatura fundamental sobre estatística:
"... o viésEθ[ δ( X) ] - g( θ ) , às vezes chamado de erro sistemático, ... "[EL Lehmann, Teoria da estimativa de pontos, 1983. Este é um texto clássico.] Na notação de Lehmann, que é padrão,Eθ é a expectativa quando a distribuição é dada pelo parâmetro θ , δ é um estimador, X é uma observação e g( θ ) é uma propriedade da distribuição a ser estimada (a estimativa). Em outras palavras, a observação (ou sequência da mesma) é uma variável aleatória, o que torna a estimativa aleatória, e o viés é o desvio esperado entre a estimativa e a estimativa. Depende da distribuição (desconhecida, mas verdadeira)θ , tornando-o uma função da verdadeira distribuição. Lehmann dedica um capítulo inteiro a estimadores imparciais: aqueles com viés zero, independentemente do valor deθ .
Na teoria das medidas, "viés" (ou "erro sistemático" ) é uma diferença entre a expectativa de uma medida e o verdadeiro valor subjacente. A polarização pode resultar de erros de calibração ou desvio instrumental, por exemplo. Compare esse uso com o anterior: aqui, um viés é uma propriedade de uma medida, que é um processo físico, enquanto antes era uma propriedade de um estimador estatístico (que é um procedimento matematicamente definido para fazer suposições a partir dos dados).
O "viés sistemático" parece ser usado apenas ao distinguir o viés do "erro" aleatório: o termo "erro" tende a ser usado principalmente para termos aleatórios com expectativa zero.
Em muitos casos, o viés no primeiro sentido diminui à medida que a quantidade de dados aumenta: muitos estimadores tendenciosos na prática se tornam cada vez menos tendenciosos com mais dados (embora isso não seja teoricamente garantido, porque o conceito de viés é muito amplo). Um bom exemplo é o estimador de probabilidade máxima da variação de uma distribuição quandon sorteios independentes xEu dessa distribuição estão disponíveis. O estimador de ML é
parax¯=1n∑ni = 1xEu . É sabido que isso é tendencioso; o estimadornn - 1v^ é imparcial. De onde, comon → ∞ , v^→nn - 1v^ torna-se assintoticamente imparcial.
O viés no contexto da medição (o segundo sentido), no entanto, geralmente não é redutível com a realização de mais medições: o viés é inerente ao próprio procedimento de medição. É preciso estimar e reduzir o viés calibrando o procedimento de medição ou comparando-o com outros procedimentos conhecidos por não ter (ou menos) viés, estimando o viés e compensando isso.
Esta breve descrição da terminologia usada para inferência estatística não suplanta as respostas estendidas e mais especializadas já publicadas. Em vez disso, pretende servir como uma introdução a eles e como um aviso moderado para desconfiar de generalizações universais feitas em contextos limitados, como "todos os três [termos] são equivalentes a 'erro sistemático'", o que claramente pode estar correto apenas em sentido estrito, porque as duas definições que citei não são equivalentes. A leitura das outras respostas me alertou para a possibilidade de que a literatura em campos especializados como epidemiologia possa estar usando termos estatísticos padrão familiares como "viés" de maneiras inesperadas, algumas das quais podem realmente contradizer as definições estatísticas. No final,
fonte
Se eu aprendi alguma coisa através dos meus estudos epidemiológicos é que este é um campo minado onde não há verdadeiro certo ou errado. Eu gosto de estatística, porque pelo menos tem um fundamento em matemática, enquanto epidemiologia é mais opinião. Dito isto, tentarei responder sua pergunta.
De M. Porta Um Dicionário de Epidemiologia 5a ed. não há menção de viés sistemático e erro sistemático diz "Veja BIAS". Isso deixa o viés descrito como: “Desvio sistemático dos resultados ou inferências da verdade. ... levando a resultados ou conclusões que são sistematicamente (opostas a aleatoriamente) diferentes da verdade. ” Eu diria que não há viés sistemático, pois todos eles desviam seus resultados da estimativa de risco real. A coisa mais importante sobre o viés é que você não pode reduzi-lo aumentando o tamanho da amostra .
Existem muitos tipos de viés, ouvi dizer que um dos artigos originais sobre viés continha mais de 300 tipos diferentes. O importante é identificá-los antes de iniciar o estudo e, em seguida, tentar configurar seu estudo / experiência para evitar distorções. Em estudos epidemiológicos, é muito útil separar o viés em três categorias:
Viés de seleção é quando você seleciona o tipo errado de pessoa para o seu estudo. Digamos que você esteja interessado em ver se trabalhar em uma mina de carvão é um risco - se você procurar os indivíduos do seu estudo na mina de carvão, poderá descobrir que eles são mais saudáveis do que a população em geral, apenas pelo fato de que aqueles que são doentes não estão mais trabalhando na mina de carvão, ou seja, você seleciona os indivíduos mais saudáveis e não estuda mais a população de origem, mas uma subamostra. O viés de seleção geralmente é o tipo de viés mais maligno, porque é muito difícil de identificar.
Viés de informação é quando sua coleta de dados sobre resultado ou exposição está com defeito. Um erro comum é o cirurgião que pergunta ao paciente se ele está melhor após a cirurgia. Aqui, o paciente pode não querer decepcionar o cirurgião e relatar um resultado melhor do que ele / ela faria e o cirurgião pode não querer admitir que a cirurgia foi um fracasso, relato e viés do entrevistador.
O viés de informação também é conhecido como viés de observação. Quando se trata de um erro em uma variável contínua, é um erro de medição, enquanto na configuração da classificação você tem um viés de classificação incorreta. Classificação incorreta significa que um indivíduo do estudo pode terminar na categoria errada; um fumante pode ser classificado como não-fumante por acaso ou enviando um viés. Mesmo que a classificação incorreta seja por acaso (classificação não diferencial), ela ainda tenderá a subestimar o risco de maneira sistemática, especialmente quando você tiver poucas categorias. Embora um excelente estudo de Jurek et al. 2005 mostrou que você deve tomar cuidado ao fazer essa suposição com base em um único estudo. Em relação à sua pergunta, posso imaginar que esse é o “viés não sistemático” que o viés sistemático relaciona.
Confundir é um fator associado à exposição e ao resultado e que se relaciona mais com o indivíduo do estudo. Por exemplo, Lambe et al. 2006 mostrou que fumar durante a gravidez aumenta o risco de baixo desempenho escolar, mas quando se olha para irmãos em uma subpopulação em que a mãe parou de fumar durante a segunda gravidez, o desempenho escolar também é ruim. Isso sugere que o fumo não é a causa do mau desempenho escolar, mas talvez um fator de confusão para outros fatores sociais.
Este artigo de Sica et al. 2006 entra em mais detalhes. O que você precisa estar preparado é que realmente existe uma falta de consenso em campo quanto à terminologia. Meu sonho é que a OMS um dia produza uma lista de definições fáceis de entender, faça sentido intuitivo e onde o debate finalmente poderá terminar.
fonte
As terminologias podem variar de campo para campo. No entanto, usando os termos definidos nos comentários abaixo:
Não, todos os três são equivalentes a 'erro sistemático'.
Não, o aumento do tamanho da amostra reduz o erro aleatório, não o erro sistemático.
Comente
Esses termos são retirados do campo da epidemiologia, especificamente da discussão de Rothman e colegas sobre o erro nos capítulos 9 e 10 da Epidemiologia Moderna .
Para resumir:
O objetivo de um investigador é fornecer uma estimativa precisa de alguma medida (por exemplo, média, risco relativo, taxa de risco etc.) dentro de uma população. Uma estimativa precisa é válida e precisa . Uma estimativa válida terá uma estimativa pontual (por exemplo, média, risco relativo, taxa de risco etc.) que se aproxima do valor real na população. Uma estimativa precisa terá níveis de confiança estreitos em torno da estimativa pontual. Além disso, uma estimativa pode ser válida internamente, em relação à população estudada, e externamente válida, em relação a uma população generalizada.
Os desvios da precisão são causados por erro . Existem dois tipos principais de erro: erro sistêmico e erro aleatório .
O erro sistêmico, geralmente chamado de viés, resulta em estimativas que não são válidas. O erro sistêmico inclui erro devido a confusão, viés de seleção e viés de informações. Geralmente, a confusão pode ser corrigida com técnicas como estratificação ou regressão. Tradicionalmente, o viés de seleção e informação é ignorado ou apenas avaliado qualitativamente nas análises, provavelmente devido ao desconhecimento das análises de viés apropriadas. No entanto, existem metodologias para análise de viés qunatitativo (por exemplo, Lash TL e AK Fink (2003) ).
O erro aleatório resulta em estimativas não precisas. O erro aleatório inclui erro de amostragem e erro de medição aleatório, entre outros. Os métodos para aumentar a precisão incluem aumentar o tamanho do estudo, aumentar a eficiência do estudo e análises estatísticas de otimização da precisão, como agrupamento e regressão.
Atualizar
Para ilustrar por que o aumento do tamanho da amostra não diminui o erro sistemático com a analogia do alvo (copiada desta publicação do CV ):
Não importa quantos dardos sejam lançados no tabuleiro, a estimativa pontual não mudará para o verdadeiro alvo quando houver um 'alto viés'. Aqui 'viés' é equivalente a 'erro sistemático' e 'variação' é equivalente a 'erro aleatório'.
fonte
Esses trechos em power point têm algumas informações para complementar o que jthetzel e Max Gordon deram. Eles são orientados para dados de pesquisa e não são rigorosos ou formais, mas se você quisesse esse tipo de resposta, provavelmente procuraria em livros didáticos sobre teoria de medição ou métodos de pesquisa.
fonte