Dadas taxas de verdadeiro positivo, falso negativo, você pode calcular o falso positivo, o negativo verdadeiro?

24

Eu tenho valores para True Positive (TP)e da False Negative (FN)seguinte maneira:

TP = 0.25
FN = 0.75

A partir desses valores, podemos calcular False Positive (FP)e True Negative (TN)?

Simplicidade
fonte

Respostas:

53

Há um pouco de confusão terminológica nessa área. Pessoalmente, sempre acho útil voltar a uma matriz de confusão para pensar sobre isso. Em um teste de classificação / triagem, você pode ter quatro situações diferentes:

                      Condition: A        Not A

  Test says “A”       True positive   |   False positive
                      ----------------------------------
  Test says “Not A”   False negative  |    True negative

Nesta tabela, "verdadeiro positivo", "falso negativo", "falso positivo" e "verdadeiro negativo" são eventos (ou sua probabilidade). O que você tem é, portanto, provavelmente uma taxa positiva verdadeira e uma taxa negativa falsa . A distinção é importante porque enfatiza que ambos os números têm um numerador e um denominador.

Onde as coisas ficam um pouco confusas é que você pode encontrar várias definições de "taxa de falsos positivos" e "taxa de falsos negativos", com diferentes denominadores.

Por exemplo, a Wikipedia fornece as seguintes definições (elas parecem bastante padrão):

  • TPR=TP/(TP+FN)
  • FPR=FP/(FP+TN)
  • TNR=TN/(FP+TN)

Em todos os casos, o denominador é o total da coluna . Isso também dá uma pista para a interpretação deles: a verdadeira taxa positiva é a probabilidade de o teste dizer "A" quando o valor real é de fato A (ou seja, é uma probabilidade condicional, condicionada a A ser verdadeira). Isso não indica a probabilidade de você estar correto ao chamar "A" (ou seja, a probabilidade de um verdadeiro positivo, condicionada ao resultado do teste ser "A").

FNR=1 1-TPR

No entanto, existem outras definições na literatura. Por exemplo, Fleiss ( métodos estatísticos para taxas e proporções ) oferece o seguinte:

  • "[...] a taxa de falsos positivos [...] é a proporção de pessoas, entre as que respondem positivamente e que estão realmente livres da doença".
  • "A taxa de falsos negativos [...] é a proporção de pessoas, entre as que responderam negativamente no teste, que ainda têm a doença."

(Ele também reconhece as definições anteriores, mas as considera "desperdiçadoras de terminologia preciosa", precisamente porque elas têm uma relação direta com sensibilidade e especificidade.)

FPR=FP/(TP+FP)FNR=FN/(TN+FN)

Fleiss não usa ou define as frases "taxa negativa verdadeira" ou "taxa positiva verdadeira", mas se assumirmos que essas também são probabilidades condicionais, dadas um determinado resultado / classificação de teste, a resposta @ guill11aume é a correta.

De qualquer forma, você precisa ter cuidado com as definições, porque não há resposta indiscutível para sua pergunta.

Gala
fonte
4
Muito bom (+1). Eu pulei imediatamente em uma interpretação, mas você está absolutamente certo de que a definição alternativa é padrão.
gui11aume
11
@ gui11aume. Obrigado! Era o meu sentimento, mas, pensando nisso, não tenho mais tanta certeza. Observando as referências, pode depender do campo (aprendizado de máquina vs. testes médicos).
Gala #
Minha experiência é que a última definição, TPR = TP / (TP + FP), FPR = FP / (TP + FP) é mais padrão.
travelingbones
11
Aqui está uma publicação sobre as diferenças: link.springer.com/article/10.1007/s10899-006-9025-5#enumeration Observe a nova terminologia "Test FPR" vs. "Predictive FPR"
travelingbones
8

EDIT: veja a resposta de Gaël Laurans, que é mais precisa.

Se a sua verdadeira taxa positiva é de 0,25, significa que toda vez que você chama um positivo, você tem uma probabilidade de 0,75 de estar errado. Esta é a sua taxa de falsos positivos. Da mesma forma, toda vez que você chama de negativo, você tem uma probabilidade de 0,25 de estar certo, que é sua verdadeira taxa negativa.

gui11aume
fonte
Depende do que se está tentando caracterizar: o teste, no cenário, de conhecer a verdade de antemão, ou tentar decidir a probabilidade do pós-teste, apenas com os resultados em mãos.
kd4ttc
3

Nenhuma se isso fizer algum sentido se "positivo" e "negativo" não fizerem sentido para o problema em questão. Vejo muitos problemas em que "positivo" e "negativo" são escolhas forçadas arbitrárias em uma variável ordinal ou contínua. FP, TP, sens, spec são úteis apenas para fenômenos de tudo ou nada.

Frank Harrell
fonte