http://www.chioka.in/differences-between-l1-and-l2-as-loss-function-and-regularization/
Se você olhar para o início deste post, o escritor menciona que a norma L2 tem uma solução única e a norma L1 tem possivelmente muitas soluções. Entendo isso em termos de regularização, mas não em termos do uso da norma L1 ou da norma L2 na função de perda.
Se você olhar para gráficos de funções do escalar x (x ^ 2 e | x |), poderá ver facilmente que ambos têm uma solução única.
regression
lasso
regularization
user3180
fonte
fonte
Respostas:
Vamos considerar um problema unidimensional para a exposição mais simples possível. (Os casos dimensionais mais altos têm propriedades semelhantes.)
Enquanto ambos|x−μ| e (x−μ)2 cada um tem um mínimo único, ∑i|xi−μ| (uma soma das funções de valor absoluto com diferentes compensações x) geralmente não. Considere x1=1 e x2=3 :
Como (fora de algumas circunstâncias específicas) você normalmente não tem essa garantia de nenhuma observação altamente influente, eu não consideraria a regressão L1 robusta.
Código R para plotagem:
fonte
plot
. A mente está soprada.Minimizar a perda de L2 corresponde ao cálculo da média aritmética, que é inequívoca, enquanto minimizar a perda de L1 corresponde ao cálculo da mediana, que é ambígua se um número par de elementos for incluído no cálculo da mediana (consulte Tendência central: soluções para problemas variacionais )
fonte