A perda de dobradiça pode ser definida usando e a perda de log pode ser definida como log ( 1 + exp ( - y i w T x i ) )
Tenho as seguintes perguntas:
Existem desvantagens da perda de dobradiça (por exemplo, sensível a valores discrepantes, como mencionado em http://www.unc.edu/~yfliu/papers/rsvm.pdf )?
Quais são as diferenças, vantagens e desvantagens de uma em relação à outra?
fonte
O @Firebug teve uma boa resposta (+1). De fato, eu tive uma pergunta semelhante aqui.
Quais são os impactos da escolha de diferentes funções de perda na classificação para aproximar a perda de 0-1
Eu só quero acrescentar mais outras grandes vantagens da perda logística: interpretação probabilística. Um exemplo pode ser encontrado aqui
Especificamente, a regressão logística é um modelo clássico na literatura estatística. (Consulte, O que o nome "Regressão logística" significa? Para a nomeação.) Há muitos conceitos importantes relacionados à perda logística, como maximizar a estimativa de probabilidade de log, testes de razão de verossimilhança e suposições sobre binômios. Aqui estão algumas discussões relacionadas.
Teste da razão de verossimilhança em R
Por que a regressão logística não é chamada de Classificação Logística?
Existe alguma suposição sobre regressão logística?
Diferença entre os modelos logit e probit
fonte
Como o @ hxd1011 adicionou uma vantagem da entropia cruzada, adicionarei uma desvantagem.
O erro de entropia cruzada é uma das muitas medidas de distância entre distribuições de probabilidade, mas uma desvantagem é que as distribuições com caudas longas podem ser modeladas de maneira inadequada, com muito peso dado aos eventos improváveis.
fonte