Análogos de sensibilidade e especificidade para resultados contínuos

8

Como posso calcular a sensibilidade e a especificidade (ou medidas análogas) de um teste de diagnóstico contínuo para prever um resultado contínuo (por exemplo, pressão sanguínea) sem dicotomizar o resultado? Alguma ideia?

Parece que os pesquisadores fizeram isso usando a modelagem de efeitos mistos (veja o link abaixo), mas não estou familiarizado com o uso da técnica: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3026390/

A propósito, eu estou mais familiarizado com o R, então seria ideal para a implementação que você sugere que seja acompanhada de uma função R (mas tudo bem se não).

Agradecemos antecipadamente por quaisquer sugestões!

Itpetersen
fonte

Respostas:

1

Como a pergunta ainda não foi respondida, eis o meu 2ct:
acho que aqui estão dois tópicos diferentes misturados nessa pergunta:

Como posso calcular a sensibilidade e a especificidade (ou medidas análogas) de um teste de diagnóstico contínuo para prever um resultado contínuo (por exemplo, pressão arterial) sem dicotomizar o resultado?

Entendo que você deseja medir o desempenho do modelo. O modelo prevê resultados contínuos (métricos) de algum tipo de entrada (também é métrica no seu exemplo, mas isso realmente não importa aqui). Este é um cenário de regressão, não uma classificação. Portanto, é melhor procurar medidas de desempenho para modelos de regressão, sensibilidade e especificidade não são o que você procura *.
Alguns problemas de regressão têm um agrupamento "natural" em presença e ausência de algo, o que fornece um link para a classificação. Para isso, você pode ter uma distribuição bimodal: muitos casos com ausência e uma distribuição métrica de valores para casos de presença. Por exemplo, pense em uma substância que contamina algum produto. Muitas das amostras do produto não conterão o contaminante, mas, para as que contêm, é observada uma variedade de concentrações.

No entanto, este não é o caso do seu exemplo de pressão arterial (ausência de pressão arterial não é um conceito sensato aqui). Eu até acho que a pressão sanguínea vem em uma distribuição unimodal. Tudo isso aponta para um problema de regressão sem vínculo estreito com a classificação.

* Com a ressalva de que ambas as palavras são usadas na química analítica para regressão (calibração), mas com um significado diferente: lá, a sensibilidade é a inclinação da função de calibração / regressão, e específico às vezes significa que o método é completamente seletivo , que é insensível a outras substâncias além do analito e não ocorrem sensibilidades cruzadas.
AD McNaught e A. Wilkinson, eds .: Compêndio de Terminologia Química (o "Livro de Ouro"). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi: 10.1351 / goldbook. URL: http://goldbook.iupac.org/ .

Análogos de sensibilidade e especificidade para resultados contínuos

Por outro lado, se a natureza subjacente do problema for uma classificação, você poderá descrevê-lo melhor por uma regressão:

  • a regressão descreve um grau de pertencimento às classes (como em conjuntos difusos).
  • a probabilidade de modelos de regressão (posteriores) de beloning para as classes (como na regressão logística )
  • seus casos podem ser descritos como misturas das classes puras (muito perto da regressão "normal", o exemplo de contaminação acima)

Para esses casos, faz sentido estender os conceitos por trás da sensibilidade e especificidade para "classificadores de resultados contínuos". A idéia básica é ponderar cada caso de acordo com seu grau de pertencimento à classe em questão. Para sensibilidade e especificidade que se referem ao rótulo de referência, para os valores preditivos para as participações previstas na classe. Acontece que isso leva a um vínculo muito próximo às medidas de desempenho do tipo regressão.

Recentemente, descrevemos isso em C. Beleites, R. Salzer e V. Sergo:
Validação de Modelos de Classificação Macia usando Associações Parciais de Classe: Um Conceito Estendido de Sensibilidade & Co. aplicado à Classificação de Tecidos de Astrocitoma
Chemom. Intell. Lab. Syst., 122 (2013), 12 - 22.

O link aponta para a página inicial do pacote R que implementa as medidas de desempenho propostas.

Novamente, o exemplo da pressão arterial IMHO não é adequadamente descrito como problema de classificação. No entanto, você ainda pode querer ler o artigo - acho que a formulação dos valores de referência deixará claro que a pressão arterial não é sensatamente descrita de uma maneira adequada para a classificação.

(Se você formular um grau contínuo de "pressão alta" que seria um modelo diferente do problema que você descreve.)


Eu dei uma rápida olhada no artigo que você vinculou, mas, se entendi corretamente, os autores usam limites (dicotomizar) para ambas as estratégias de modelagem: para a previsão contínua é processada ainda mais: um intervalo de previsão é calculado e comparado com algum limite. No final, eles têm uma previsão dicotômica e geram o ROC variando a especificação para o intervalo.
Como você especifica que deseja evitar isso, o documento não parece ser excessivamente relevante.

cbeleites descontentes com o SX
fonte
Parece que os métodos nesse artigo são altamente problemáticos. A pergunta original não foi respondida porque implica um uso de metodologia questionável.
31813 Frank Harrell
@FrankHarrell: sim, pelo menos a nomeação do método no artigo é enganosa, pois a previsão final não é contínua. Mas entendi a menção do artigo como mostrando que o OP examinava a literatura e achava que o artigo poderia ajudar - o que não ajuda.
cbeleites descontente com SX
2

Tentar fazer isso com variáveis ​​contínuas exporá os problemas graves com medidas de ordem temporal inversa, mesmo no caso binário (isto é, prever X de Y em geral).

Frank Harrell
fonte
Não precisa ser feito com medidas de ordem temporal inversa. Estou apenas procurando um análogo de sensibilidade e especificidade no caso em que o resultado ou variável dependente é contínuo.
itpetersen
XY
2
R2Dxy
2
DxyYXYcYY
Postado
2
Meus pacotes R Hmisce rmslidam com isso. Em Hmiscveja a rcorr.censfunção.
Frank Harrell
0

Em poucas palavras, sensibilidade significa a capacidade de responder a algo se estiver presente, e especificidade significa a capacidade de suprimir a resposta quando está ausente. Para variáveis ​​contínuas, a sensibilidade corresponde à inclinação da regressão das medidas obtidas nos valores reais da variável que está sendo medida e a especificidade corresponde ao erro padrão de medição (ou seja, o desvio padrão das medidas obtidas quando a quantidade sendo medida não varia).

EDIT, respondendo aos comentários de Frank Harrell e cbeleites. Eu estava tentando dar análogos conceituais de sensibilidade e especificidade. Para variáveis ​​contínuas, a idéia básica de sensibilidade é que, se dois objetos (ou o mesmo objeto em momentos diferentes ou sob condições diferentes, etc.) diferem na variável que estamos tentando medir, então nossas medidas obtidas também devem diferir, com maior verdadeiro diferenças levando a maiores diferenças medidas.

YXEY|XXYXXXX

YXYXYXYY|XX- é uma medida inversa de especificidade. A razão da inclinação condicional sobre o sd condicional é uma relação sinal / ruído, e seu quadrado é referido na psicometria como a função de informação.

Ray Koopman
fonte
Isso não parece certo. A especificidade não envolve variações e sens. e especificação. aplica-se apenas a quantidades binárias.
Frank Harrell
@ Ray: o significado / definição de ambos os termos para regressão (calibração química) é tão diferente de seu significado na classificação que isso deve ser enfatizado com mais ênfase. Mas nunca ouvi falar da sua definição de especificidade. Você pode dar uma referência?
cbeleites descontente com SX