Como a pergunta ainda não foi respondida, eis o meu 2ct:
acho que aqui estão dois tópicos diferentes misturados nessa pergunta:
Como posso calcular a sensibilidade e a especificidade (ou medidas análogas) de um teste de diagnóstico contínuo para prever um resultado contínuo (por exemplo, pressão arterial) sem dicotomizar o resultado?
Entendo que você deseja medir o desempenho do modelo. O modelo prevê resultados contínuos (métricos) de algum tipo de entrada (também é métrica no seu exemplo, mas isso realmente não importa aqui). Este é um cenário de regressão, não uma classificação. Portanto, é melhor procurar medidas de desempenho para modelos de regressão, sensibilidade e especificidade não são o que você procura *.
Alguns problemas de regressão têm um agrupamento "natural" em presença e ausência de algo, o que fornece um link para a classificação. Para isso, você pode ter uma distribuição bimodal: muitos casos com ausência e uma distribuição métrica de valores para casos de presença. Por exemplo, pense em uma substância que contamina algum produto. Muitas das amostras do produto não conterão o contaminante, mas, para as que contêm, é observada uma variedade de concentrações.
No entanto, este não é o caso do seu exemplo de pressão arterial (ausência de pressão arterial não é um conceito sensato aqui). Eu até acho que a pressão sanguínea vem em uma distribuição unimodal. Tudo isso aponta para um problema de regressão sem vínculo estreito com a classificação.
* Com a ressalva de que ambas as palavras são usadas na química analítica para regressão (calibração), mas com um significado diferente: lá, a sensibilidade é a inclinação da função de calibração / regressão, e específico às vezes significa que o método é completamente seletivo , que é insensível a outras substâncias além do analito e não ocorrem sensibilidades cruzadas.
AD McNaught e A. Wilkinson, eds .: Compêndio de Terminologia Química (o "Livro de Ouro"). Blackwell Scientific, 1997. ISBN: 0-9678550-9-8. DOI: doi: 10.1351 / goldbook. URL: http://goldbook.iupac.org/ .
Análogos de sensibilidade e especificidade para resultados contínuos
Por outro lado, se a natureza subjacente do problema for uma classificação, você poderá descrevê-lo melhor por uma regressão:
- a regressão descreve um grau de pertencimento às classes (como em conjuntos difusos).
- a probabilidade de modelos de regressão (posteriores) de beloning para as classes (como na regressão logística )
- seus casos podem ser descritos como misturas das classes puras (muito perto da regressão "normal", o exemplo de contaminação acima)
Para esses casos, faz sentido estender os conceitos por trás da sensibilidade e especificidade para "classificadores de resultados contínuos". A idéia básica é ponderar cada caso de acordo com seu grau de pertencimento à classe em questão. Para sensibilidade e especificidade que se referem ao rótulo de referência, para os valores preditivos para as participações previstas na classe. Acontece que isso leva a um vínculo muito próximo às medidas de desempenho do tipo regressão.
Recentemente, descrevemos isso em
C. Beleites, R. Salzer e V. Sergo:
Validação de Modelos de Classificação Macia usando Associações Parciais de Classe: Um Conceito Estendido de Sensibilidade & Co. aplicado à Classificação de Tecidos de Astrocitoma
Chemom. Intell. Lab. Syst., 122 (2013), 12 - 22.
O link aponta para a página inicial do pacote R que implementa as medidas de desempenho propostas.
Novamente, o exemplo da pressão arterial IMHO não é adequadamente descrito como problema de classificação. No entanto, você ainda pode querer ler o artigo - acho que a formulação dos valores de referência deixará claro que a pressão arterial não é sensatamente descrita de uma maneira adequada para a classificação.
(Se você formular um grau contínuo de "pressão alta" que seria um modelo diferente do problema que você descreve.)
Eu dei uma rápida olhada no artigo que você vinculou, mas, se entendi corretamente, os autores usam limites (dicotomizar) para ambas as estratégias de modelagem: para a previsão contínua é processada ainda mais: um intervalo de previsão é calculado e comparado com algum limite. No final, eles têm uma previsão dicotômica e geram o ROC variando a especificação para o intervalo.
Como você especifica que deseja evitar isso, o documento não parece ser excessivamente relevante.
Tentar fazer isso com variáveis contínuas exporá os problemas graves com medidas de ordem temporal inversa, mesmo no caso binário (isto é, prever X de Y em geral).
fonte
R
Hmisc
erms
lidam com isso. EmHmisc
veja arcorr.cens
função.Em poucas palavras, sensibilidade significa a capacidade de responder a algo se estiver presente, e especificidade significa a capacidade de suprimir a resposta quando está ausente. Para variáveis contínuas, a sensibilidade corresponde à inclinação da regressão das medidas obtidas nos valores reais da variável que está sendo medida e a especificidade corresponde ao erro padrão de medição (ou seja, o desvio padrão das medidas obtidas quando a quantidade sendo medida não varia).
EDIT, respondendo aos comentários de Frank Harrell e cbeleites. Eu estava tentando dar análogos conceituais de sensibilidade e especificidade. Para variáveis contínuas, a idéia básica de sensibilidade é que, se dois objetos (ou o mesmo objeto em momentos diferentes ou sob condições diferentes, etc.) diferem na variável que estamos tentando medir, então nossas medidas obtidas também devem diferir, com maior verdadeiro diferenças levando a maiores diferenças medidas.
fonte