Eu tenho o modelo para a regressão logística para multiclasse, que é dada por
onde k é o número de classes teta é o parâmetro a ser estimado j é a j-ésima classe Xi são os dados de treinamento
Bem, uma coisa que não entendi é como a parte do denominador normalizou o modelo. Quero dizer, faz com que a probabilidade fique entre 0 e 1.
Quero dizer, estou acostumado a regressão logística sendo
Na verdade, estou confuso com a coisa da nomalização. Nesse caso, como é uma função sigmóide, nunca permite que o valor seja menor que 0 ou maior que 1. Mas estou confuso no caso de várias classes. Por que é tão?
Esta é a minha referência https://list.scms.waikato.ac.nz/pipermail/wekalist/2005-February/029738.html . Eu acho que deveria estar normalizando
logistic
multinomial
user34790
fonte
fonte
Respostas:
Sua fórmula está incorreta (o limite superior da soma). Na regressão logística com classes ( ), você basicamente cria modelos de regressão logística binária onde você escolhe uma classe como referência ou pivô. Normalmente, a última classe é selecionada como referência. Assim, a probabilidade da classe de referência pode ser calculada porA forma geral da probabilidade éComo a classe é a sua referência e, portanto,K > 2 K - 1 K P ( y i = K | x i ) = 1 - K - 1 ∑ k = 1 P ( y i = k | x i ) . P ( y i = k | x i ) = exp ( θ T i x i )K K> 2 K- 1 K
fonte
Acho que você está sendo confundido por um erro de digitação: seu deve ser na primeira equação. Os 1s que você vê no caso logístico são na verdade s, por exemplo, quando existe um th . k - 1 exp ( 0 ) k θ = 0k k - 1 exp( 0 ) k θ = 0
Suponha que . Agora observe que você pode ir da última formulação à versão de regressão logística como Para várias classes, basta substituir o denominador nas duas primeiras quantidades por uma soma sobre os preditores lineares exponenciados. exp ( b )θ1 1X= b
fonte