limiar de cálculo para classificador de risco mínimo?

11

Suponha que duas classes e C 2 tenham um atributo x e tenham distribuição N ( 0 , 0,5 ) e N ( 1 , 0,5 ) . se tivermos igual P anterior ( C 1 ) = P ( C 2 ) = 0,5 para a seguinte matriz de custo:C1C2xN(0,0.5)N(1,0.5)P(C1)=P(C2)=0.5

L=[00.510]

por que é o limite para o classificador de risco (custo) mínimo?x0<0.5

Este é o meu exemplo de observação que eu entendi errado (por exemplo, como esse limite é atingido?)

Edit 1: Acho que para os limiares da razão de verossimilhança podemos usar P (C1) / P (C2).

Editar 2: adiciono do Duda Book on Pattern algum texto sobre o limiar. insira a descrição da imagem aqui

user153695
fonte

Respostas:

4

L=[00.510]c1c2predictionc1c2truth

c1c2L12=0.5c2c1L21=1L11=L22=0Rk

R(c1|x)=L11Pr(c1|x)+L12Pr(c2|x)=L12Pr(c2|x)R(c2|x)=L22Pr(c2|x)+L21Pr(c1|x)=L21Pr(c1|x)

Para minimizar o risco / perda, você prevê se o custo do erro ao fazê-lo (que é a perda da previsão incorreta multiplicada pela probabilidade posterior de que a previsão esteja errada ) é menor do que o custo de prever erroneamente a alternativa,c1L12Pr(c2|x)

L12Pr(c2|x)<L21Pr(c1|x)L12Pr(x|c2)Pr(c2)<L21Pr(x|c1)Pr(c1)L12Pr(c2)L21Pr(c1)<Pr(x|c1)Pr(x|c2)
onde a segunda linha usa a regra de Bayes . Dadas probabilidades anteriores iguais obtém Pr(c2|x)Pr(x|c2)Pr(c2)Pr(c1)=Pr(c2)=0.5
12<Pr(x|c1)Pr(x|c2)

portanto, você escolhe classificar uma observação, pois é a razão de probabilidade que excede esse limite. Agora, não está claro para mim se você deseja conhecer o "melhor limite" em termos de razão de verossimilhança ou em termos do atributo . A resposta muda de acordo com a função de custo. Usando o gaussiano na desigualdade com e , , c1xσ1=σ2=σμ1=0μ2=1

12<12πσexp[12σ2(xμ1)2]12πσexp[12σ2(xμ2)2]log(12)<log(12πσ)12σ2(x0)2[log(12πσ)12σ2(x1)2]log(12)<x22σ2+x22σ22x2σ2+12σ2xσ2<12σ2log(12)x<12log(12)σ2
portanto, um limite de previsão em termos dexpois a pesquisa só pode ser alcançada se as perdas de previsões falsas forem iguais, ou seja, porque somente então você poderá e você obtém o .L12=L21log(L12L21)=log(1)=0x0<12
Andy
fonte
Boa resposta, mas me confundiu! se você quiser escolher ou , qual está correto? x0=0.5x0<0.5
user153695
Portanto, no limite de decisão você não pode dizer exatamente se uma observação deve estar na classe um ou dois (porque está exatamente no limite). Portanto, escolhendo se a observação deveria estar na classe 1 se ou for com você. Com amostras grandes o suficiente, isso deve ocorrer para pouquíssimas observações; portanto, na margem, será muito importante para o seu resultado. x0=0.5ix00.5x0<0.5
Andy
todo o meu problema, que recompensa esse prof. calculado e não aceitar , veja minha edição em questão. O limite mínimo deve ser . x0<0.5x0=0.5x0<0.5
user153695
talvez 0,5-ln :)
user153695
1
@ whuber obrigado, eu perdi completamente isso, então comecei de um fim completamente errado.
Andy