Embora as respostas de @ Tim ♦ e @ gung ♦ cubram praticamente tudo, tentarei sintetizá-las em uma única e fornecer esclarecimentos adicionais.
O contexto das linhas citadas pode se referir principalmente a testes clínicos na forma de um determinado limiar, como é mais comum. Imagine uma doença e tudo além de D, incluindo o estado saudável referido como D c . Nós, para o nosso teste, gostaríamos de encontrar alguma medida de proxy que nos permita obter uma boa previsão para D. (1) A razão pela qual não obtemos especificidade / sensibilidade absolutas é que os valores de nossa quantidade de proxy não se correlacionam perfeitamente com o estado da doença, mas apenas geralmente se associa a ele e, portanto, em medições individuais, podemos ter uma chance dessa quantidade cruzar nosso limiar para D cDDDcDDcindivíduos e vice-versa. Por uma questão de clareza, vamos assumir um modelo gaussiano de variabilidade.
Digamos que estamos usando como quantidade proxy. Se x tiver sido bem escolhido, então E [ x D ] deverá ser maior que E [ x D c ] ( E é o operador de valor esperado). Agora, o problema surge quando percebemos que D é uma situação composta (o mesmo acontece com D c ), na verdade composta de 3 graus de gravidade D 1 , D 2 , D 3 , cada um com um valor esperado progressivamente crescente para x . Para um único indivíduo, selecionado entrexxE[ xD]E[ xD c]EDDcD1 1D2D3xCategoria D ou da categoria D c , as probabilidades de o 'teste' se tornar positivo ou não dependerão do valor limite escolhido. Digamos que escolhemos x T com base no estudo de uma amostra verdadeiramente aleatória comindivíduos D e D c . Nosso x T causará alguns falsos positivos e negativos. Se selecionarmos umapessoaaleatoriamente, a probabilidade que governa seuvalorse dado pelo gráfico verde e a de umapessoaescolhida aleatoriamentepelo gráfico vermelho.DDcxTDDcxTDxDc
Os números reais obtidos dependerão dos números reais de indivíduos e mas a especificidade e a sensibilidade resultantes não. Seja uma função cumulativa de probabilidade. Então, para a prevalência de da doença , aqui está uma tabela 2x2, como seria de esperar do caso geral, quando tentamos realmente ver como o nosso teste se comporta na população combinada.DDcF()pD
(D,+)=p(1−FD(xT))
(Dc,−)=(1−p)(1−FDc(xT))
(D,−)=p(FD(xT))
(Dc,+)=(1−p)∗FDc(xT)
Os números reais são dependentes de , mas a sensibilidade e a especificidade são independentes de . Mas, ambos são dependentes de e . Portanto, todos os fatores que os afetam definitivamente mudarão essas métricas. Se estivéssemos, por exemplo, trabalhando na UTI, nosso seria substituído por e, se pacientes ambulatoriais, substituído por . É uma questão separada que, no hospital, a prevalência também é diferente,p F D F D c F D F D 3 F D 1 D c D c x D D c F D F D c D F FppFDFDcFDFD3FD1mas não é a prevalência diferente que está causando diferenças nas sensibilidades e especificidades, mas a distribuição diferente, uma vez que o modelo no qual o limiar foi definido não era aplicável à população que aparecia como paciente ambulatorial ou internado . Você pode ir em frente e dividir em várias subpopulações, porque a subpartição de internamento de também terá um elevado devido a outras razões (uma vez que a maioria dos proxies também é 'elevada' em outras condições graves). A quebra da população em subpopulação explica a mudança na sensibilidade, enquanto a da população explica a mudança na especificidade (por mudanças correspondentes em eDcDcxDDcFDFDc ). Isto é o que o gráfico composto realmente compreende. Cada uma das cores terá seu próprio e, portanto, contanto que seja diferente do no qual a sensibilidade e a especificidade originais foram calculadas, essas métricas serão alteradas.DFF
Exemplo
Suponha uma população de 11550 com 10000 Dc, 500,750,300 D1, D2, D3, respectivamente. A parte comentada é o código usado para os gráficos acima.
set.seed(12345)
dc<-rnorm(10000,mean = 9, sd = 3)
d1<-rnorm(500,mean = 15,sd=2)
d2<-rnorm(750,mean=17,sd=2)
d3<-rnorm(300,mean=20,sd=2)
d<-cbind(c(d1,d2,d3),c(rep('1',500),rep('2',750),rep('3',300)))
library(ggplot2)
#ggplot(data.frame(dc))+geom_density(aes(x=dc),alpha=0.5,fill='green')+geom_density(data=data.frame(c(d1,d2,d3)),aes(x=c(d1,d2,d3)),alpha=0.5, fill='red')+geom_vline(xintercept = 13.5,color='black',size=2)+scale_x_continuous(name='Values for x',breaks=c(mean(dc),mean(as.numeric(d[,1])),13.5),labels=c('x_dc','x_d','x_T'))
#ggplot(data.frame(d))+geom_density(aes(x=as.numeric(d[,1]),..count..,fill=d[,2]),position='stack',alpha=0.5)+xlab('x-values')
Podemos calcular facilmente os meios x para as várias populações, incluindo Dc, D1, D2, D3 e o composto D.
mean(dc)
mean(d1)
mean(d2)
mean(d3)
mean(as.numeric(d[,1]))
> mean(dc) [1] 8.997931
> mean(d1) [1] 14.95559
> mean(d2) [1] 17.01523
> mean(d3) [1] 19.76903
> mean(as.numeric(d[,1])) [1] 16.88382
Para obter uma tabela 2x2 para o nosso caso de teste original, primeiro definimos um limite com base nos dados (que em um caso real seriam definidos após a execução do teste, como mostra o @gung). De qualquer forma, assumindo um limite de 13,5, obtemos a seguinte sensibilidade e especificidade quando computados em toda a população.
sdc<-sample(dc,0.1*length(dc))
sdcomposite<-sample(c(d1,d2,d3),0.1*length(c(d1,d2,d3)))
threshold<-13.5
truepositive<-sum(sdcomposite>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sdcomposite<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity<-truepositive/length(sdcomposite)
specificity<-truenegative/length(sdc)
print(c(sensitivity,specificity))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1]139 928 72 16
> print(c(sensitivity,specificity)) [1] 0.8967742 0.9280000
Vamos supor que estamos trabalhando com pacientes ambulatoriais e só temos pacientes doentes na proporção D1, ou estamos trabalhando na UTI onde só temos D3. (para um caso mais geral, também precisamos dividir o componente Dc). Como nossa sensibilidade e especificidade mudam? Alterando a prevalência (ou seja, alterando a proporção relativa de pacientes pertencentes a ambos os casos, não alteramos a especificidade e a sensibilidade. De fato, acontece que essa prevalência também muda com a alteração da distribuição)
sdc<-sample(dc,0.1*length(dc))
sd1<-sample(d1,0.1*length(d1))
truepositive<-sum(sd1>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd1<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity1<-truepositive/length(sd1)
specificity1<-truenegative/length(sdc)
print(c(sensitivity1,specificity1))
sdc<-sample(dc,0.1*length(dc))
sd3<-sample(d3,0.1*length(d3))
truepositive<-sum(sd3>13.5)
truenegative<-sum(sdc<=13.5)
falsepositive<-sum(sdc>13.5)
falsenegative<-sum(sd3<=13.5)
print(c(truepositive,truenegative,falsepositive,falsenegative))
sensitivity3<-truepositive/length(sd3)
specificity3<-truenegative/length(sdc)
print(c(sensitivity3,specificity3))
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 38 931 69 12
> print(c(sensitivity1,specificity1)) [1] 0.760 0.931
> print(c(truepositive,truenegative,falsepositive,falsenegative)) [1] 30 944 56 0
> print(c(sensitivity3,specificity3)) [1] 1.000 0.944
Para resumir, um gráfico para mostrar a mudança de sensibilidade (a especificidade seguiria uma tendência semelhante se também compuséssemos a população Dc a partir de subpopulações) com média variável x para a população, aqui está um gráfico
df<-data.frame(V1=c(sensitivity,sensitivity1,sensitivity3),V2=c(mean(c(d1,d2,d3)),mean(d1),mean(d3)))
ggplot(df)+geom_point(aes(x=V2,y=V1),size=2)+geom_line(aes(x=V2,y=V1))
- D
Como já foi dito por outros, sensibilidade e especificidade não dependem da prevalência. Sensibilidade é a proporção de verdadeiros positivos entre todos os positivos e especificidade é a proporção de verdadeiros negativos entre todos os negativos. Portanto, se a sensibilidade for 90%, o teste estará correto em 90% dos casos positivos. Obviamente, 90% de algo menor e 90% de algo maior ainda é 90% ...
Portanto, considerando os dados tabulares que você mencionou,
Mas a citação também parece estar dizendo outra coisa
então os autores dizem que a sensibilidade difere em diferentes grupos. Eu acho que pacientes internados e ambulatoriais podem diferir em muitos aspectos, não apenas na prevalência, portanto alguns outros fatores podem influenciar a sensibilidade. Então, eu concordo que eles podem mudar entre conjuntos de dados diferentes, que diferem em prevalência, mas a mudança não será uma função da prevalência em si (como mostra @gung em sua resposta).
e, em muitos casos, essa é a probabilidade na qual as pessoas estão interessadas ("qual a probabilidade de um paciente com um resultado positivo para realmente ter a doença?") e depende da prevalência. Observe que também o seu link discute o impacto da prevalência no valor preditivo positivo, ou seja, a probabilidade posterior, não na sensibilidade.
fonte
Veja minha resposta aqui em taxas de verdadeiro / falso positivo / negativo.
Sensibilidade é apenas outro nome para a verdadeira taxa positiva e a especificidade é a mesma que a verdadeira taxa negativa. Tanto a sensibilidade quanto a especificidade são probabilidades condicionais; eles condicionam o status da doença do paciente. Portanto, a prevalência da doença (ou seja, a probabilidade a priori de um paciente ter a doença) é irrelevante, pois você está assumindo um estado específico da doença.
Não posso comentar por que o autor do livro afirma que a sensibilidade e a especificidade dependem do contexto clínico. Estas são observações empíricas?
fonte
Obviamente, não posso falar com as intenções do autor, mas aqui estaria o meu raciocínio para essa afirmação:
Considere o contexto clínico como um teste de diagnóstico em si. Um com sensibilidade e especificidade muito baixas, mas um teste não obstante. Se você estiver no hospital, é provável que esteja doente. Se você não estiver no hospital, provavelmente não ficará doente.
Nessa perspectiva, o teste de diagnóstico real que você executa é, na verdade, a segunda parte de dois testes feitos em série.
fonte
Isso deve ser um erro. Acho que talvez o autor esteja tentando sugerir que o valor preditivo positivo e negativo (VPP e VPN) depende da prevalência (assim como da sensibilidade e especificidade). Estes são frequentemente discutidos com testes de diagnóstico e, para um clínico, talvez mais valiosos que a interpretação bruta de sensibilidade e especificidade.
Este gráfico demonstra a relação entre o VPP e o VPN com prevalência, para um teste com sensibilidade de 95% e especificidade de 85%.
De Mausner JS, Kramer S: Epidemiologia de Mausner e Bahn: um texto introdutório. Philadelphia, WB Saunders, 1985, p. 221
fonte
@Satwik, @gung e @Tim já forneceram muitos detalhes, mas tentarei adicionar um pequeno exemplo de como o caso de fatores subjacentes pode causar esse efeito.
Um Princípio Chave: Viés
Os testes estatísticos de sensibilidade / especificidade e TODOS compartilham a mesma ressalva: aplica-se apenas à repetição do mesmo procedimento de amostragem de antes, de maneira imparcial.
Os hospitais são organizações funcionais projetadas para realizar amostragens tendenciosas, usando políticas de admissão para filtrar a população em geral para aquelas que requerem admissão e tratamento. Isso é muito antítese do procedimento científico. Se você deseja saber como um teste é executado em diferentes populações, ele precisa ser testado em diferentes populações.
O efeito latente: Correlação
É raro (ou impossível no mundo real, se você quiser ser rigoroso) um diagnóstico ser independente / ortogonal a todos os outros fatores de risco de uma doença, portanto, existe algum grau de correlação.
Se a tela de admissão no hospital estiver correlacionada positivamente com o diagnóstico, o que você encontrará é que as pessoas que passam no teste de admissão têm predisposição favorável a resultados positivos pelo diagnóstico, proporcional à correlação. Assim, os verdadeiros positivos são enriquecidos e os falsos negativos são reduzidos em quantidades proporcionais à correlação.
Isso então faz a sensibilidade parecer maior.
A explicação do fenômeno
Uma observação de que a sensibilidade pode ser maior em um contexto hospitalar não é, portanto, irrealista. De fato, se a política de admissões for bem pensada e adequada ao objetivo, espera-se que isso ocorra.
Não é evidência de uma quebra no pressuposto de que a sensibilidade e a especificidade são independentes da prevalência, mas sim uma amostra tendenciosa com base na política de internação hospitalar.
O qual, dado que um hospital existe para tratar pessoas e não para fazer experimentos científicos, é definitivamente uma coisa boa.
Mas isso dá aos cientistas uma dor de cabeça.
fonte