Uma norma é única (pelo menos em parte) porque está no limite entre não convexo e convexo. Uma norma é a norma convexa 'mais esparsa' (certo?).
Entendo que a norma euclidiana tem raízes na geometria e tem uma interpretação clara quando as dimensões têm as mesmas unidades. Mas não entendo por que é usado preferencialmente sobre outros números reais : ? ? Por que não usar a faixa contínua completa como um hiperparâmetro?
o que estou perdendo?
regression
regularization
sparse
Trenton
fonte
fonte
Respostas:
Uma explicação mais matemático é que o espaço , que consiste de todas as séries que convergem em p-norma, só é Hilbert com p = 2 e nenhum outro valor. Isso significa que esse espaço está completo e a norma nesse espaço pode ser induzida por um produto interno (pense no produto pontual familiar em R n ), por isso é um pouco melhor trabalhar com isso.lp p=2 Rn
fonte
Aqui estão algumas razões:
Está relacionado de uma maneira muito especial ao produto interno: é sua própria norma dupla (ou seja, é "auto-dual").ℓ2 z ℓ2 z ∥x∥22=x⋅x ℓp
Isso significa que, se você considerar todos os vetores dentro da esfera de unidade , seu produto interno máximo com qualquer vetor z é a norma ℓ 2 da própria z . Com menos fantasia, ela satisfaz a propriedade de que " x " 2 2 = x ⋅ x . Nenhum outro ℓ p norma se comporta dessa maneira.
Tem um muito gradiente convenientemente suavizar: Você realmente não pode bater isso!
fonte
Embora possa haver muitos outros motivos, o AFAIK p = 2 é o preferido pelos seguintes motivos:
fonte
Erros quadráticos em modelos lineares são frequentemente preferidos devido a:
fonte