Por que a regressão logística é um classificador linear?

49

Como estamos usando a função logística para transformar uma combinação linear da entrada em uma saída não linear, como a regressão logística pode ser considerada um classificador linear?

A regressão linear é como uma rede neural sem a camada oculta, então por que as redes neurais são consideradas classificadores não lineares e a regressão logística é linear?

Jack Twain
fonte
7
Transformar "uma combinação linear da entrada em uma saída não linear" é uma parte básica da definição de um Classificador Linear . Isso reduz essa questão à segunda parte, o que significa demonstrar que as redes neurais geralmente não podem ser expressas como classificadores lineares.
whuber
11
@whuber: Como você explica o fato de que um modelo de regressão logística pode assumir variáveis de previsão polinomiais (por exemplo ) para produzir uma fronteira de decisão não-linear? Ainda é um classificador linear? W1 1x1 12+W2x23
stackoverflowuser2010
4
@Stack O conceito de "classificador linear" parece originar-se do conceito de modelo linear. A "linearidade" em um modelo pode assumir várias formas, conforme descrito em stats.stackexchange.com/a/148713 . Se aceitarmos a caracterização da Wikipedia de classificadores lineares , seu exemplo polinomial seria visto como não linear em termos dos "recursos" fornecidos e x 2, mas seria linear em termos dos recursos x 2 1 e x 3 2 . Essa distinção fornece uma maneira útil de explorar as propriedades da linearidade.x1 1x2x1 12x23
whuber
11
Ainda estou um pouco confuso sobre a questão: o limite de decisão de um classificador logístico é linear? Eu segui o curso de aprendizado de máquina de Andrew Ng no Coursera e ele mencionou o seguinte :! [Insira a descrição da imagem aqui ] ( i.stack.imgur.com/gHxfr.png ) Então, na verdade, parece-me que não há ninguém para responder depende da linearidade ou não linearidade do limite de decisão, que depende da função Hipótese definida como Htheta (X) onde X é a entrada e Theta é as variáveis ​​do nosso problema. Isso faz sentido para você?
brokensword

Respostas:

42

Regressão logística é linear no sentido de que as previsões pode ser escrito como p = 1 Deste modo, a previsão pode ser escrita em termos de μ , que é uma função linear dex. (Mais precisamente, as chances de log previstas são uma função linear dex.)

p^=1 11 1+e-μ^, Onde μ^=θ^x.
μ^xx

Por outro lado, não há como resumir a saída de uma rede neural em termos de uma função linear de , e é por isso que as redes neurais são chamadas não lineares.x

Além disso, para regressão logística, a fronteira de decisão é linear: é a solução para qx = 0 . O limite de decisão de uma rede neural geralmente não é linear.{x:p^=0,5}θ^x=0 0

Stefan Wager
fonte
2
Você responde é o mais claro e descomplicado para mim até agora. Mas estou um pouco confuso. Algumas pessoas dizem que as chances de log predicadas são uma função linear de e outras dizem que é uma função linear de θ . Assim?! xθ
Jack Twain
11
depois também pela sua explicação. Podemos dizer que a predicação da rede neural é uma função linear das ativações da última camada oculta?
Jack Twain
2
O log-probabilidades preditos θx é linear em ambos θ e x . Mas geralmente estamos mais interessados ​​no fato de que as chances do log são lineares em x , porque isso implica que o limite de decisão é linear no espaço x . θ^xθ^xxx
Stefan Wager
3
Eu tenho usado a definição de que um classificador é linear se seu limite de decisão é linear no espaço . Isso não é o mesmo que as probabilidades previstas serem lineares em x (o que seria impossível além de casos triviais, pois as probabilidades devem estar entre 0 e 1). xx
Stefan Wager
3
@ Pegah Eu sei que isso é antigo, mas: A regressão logística tem um limite de decisão linear. O próprio resultado não é linear, é claro, sua logística. Dependendo do lado da linha em que um ponto cai, a produção total se aproximará (mas nunca alcançará) 0 ou 1, respectivamente. E para acrescentar à resposta de Stefan Wagners: A última frase não está totalmente correta, uma rede neural não é linear quando contém ativações não lineares ou funções de saída. Mas também pode ser linear (caso não tenham sido adicionadas não linearidades).
Chris
20

Como observa Stefan Wagner, o limite de decisão para um classificador logístico é linear. (O classificador precisa que as entradas sejam linearmente separáveis.) Eu queria expandir a matemática para isso, caso não seja óbvio.

1 11 1+e-θx=0,5

1 1=e-θx

e, tomando o log natural de ambos os lados,

0 0=-θx=-Eu=0 0nθEuxEu

então o limite de decisão é linear.

A razão pela qual o limite de decisão para uma rede neural não é linear é porque existem duas camadas de funções sigmóides na rede neural: uma em cada um dos nós de saída mais uma função sigmóide adicional para combinar e limitar os resultados de cada nó de saída.

Phil Bogle
fonte
2
Na verdade, você pode obter um limite de decisão não linear com apenas uma camada tendo uma ativação. Veja o exemplo padrão de um XOR com uma rede de feed-forward de duas camadas.
James Hirschorn 19/03/19
5

C0 0C1 1

P(C0 0|x)=P(x|C0 0)P(C0 0)P(x)
P(C0 0|x)=P(x|C0 0)P(C0 0)P(x|C0 0)P(C0 0)+P(x|C1 1)P(C1 1)=1 11 1+exp(-registroP(x|C0 0)P(x|C1 1)-registroP(C0 0)P(C1 1))
1 1+eωx

P(x|CEu)=exp(θEux-b(θEu)uma(ϕ)+c(x,ϕ))
registroP(x|C0 0)P(x|C1 1)=[(θ0 0-θ1 1)x-b(θ0 0)+b(θ1 1)]/uma(ϕ)

Observe que assumimos que ambas as distribuições pertencem à mesma família e têm os mesmos parâmetros de dispersão. Mas, sob esse pressuposto, a regressão logística pode modelar as probabilidades para toda a família de distribuições exponenciais.

jpmuc
fonte