As duas formulações são equivalentes no sentido de que para cada valor de na primeira formulação, existe um valor de para a segunda formulação, de modo que as duas formulações tenham o mesmo minimizador .tλβ
Aqui está a justificativa:
Considere a formulação do laço:
Deixe o minimizador ser e seja . Minha afirmação é que, se você definir na primeira formulação, a solução da primeira formulação também será . Aqui está a prova:
f(β)=12||Y−Xβ||22+λ||β||1
β∗b=||β∗||1t=bβ∗
Considere a primeira formulação
Se possível, deixe que a segunda formulação tenha uma solução modo que (observe o sinal estritamente menor que). Então é fácil ver que contradiz o fato de que é uma solução para o laço. Assim, a solução para a primeira formulação também é . beta | | beta | | 1<| | β*| | 1=bf( β )<f(β*)β*β*
min12||Y−Xβ||22 s.t.||β||1≤b
β^| | β^| |1< | | β∗| |1= bf( β^) < f( β∗)β∗β∗
Como , a condição de folga complementar é satisfeita no ponto de solução .β ∗t = bβ∗
Portanto, dada uma formulação de laço com , você constrói uma formulação restrita usando um igual ao valor da norma da solução de laço. Por outro lado, dada uma formulação restrita com , você encontra modo que a solução para o laço seja igual à solução da formulação restrita.t l 1 t λλteu1tλ
(Se você conhece sub-alunos, pode encontrar isso resolvendo a equação , em queλz ∗ ∈ ∂ | | β * | | 1 )XT( y- Xβ∗) = λ z∗z∗∈ ∂| | β∗| |1)
Acho que a idéia de elexhobby para essa prova é boa, mas não acho que esteja completamente correta.
Ao mostrar que a existência de uma solução para a primeira formulação, , é tal queleva a uma contradição, só podemos assumir a necessidade de, não que . ‖ β ‖<‖β*‖‖ β ‖=‖β*‖ β =β*β^ ∥β^∥<∥β∗∥ ∥β^∥=∥β∗∥ β^=β∗
Sugiro, em vez disso, que procedamos da seguinte maneira:
Por conveniência, vamos denotar por e a primeira e a segunda formulação, respectivamente. Vamos supor que tenha uma solução exclusiva, , com . Deixe ter uma solução, . Então, nós temos esse(não pode ser maior por causa da restrição) e, portanto, . Se então não é a solução para o , o que contradiz nossas suposições. SeP 2 P 2 β ∗P1 P2 P2 β∗ P 1 β ≠ β * ‖ β ‖ ≤ ‖ β * ‖ f ( β ) ≤ f ( β * ) f ( β ) < f ( β * ) β * P 2 f ( β )∥β∗∥=b P1 β^≠β∗ ∥β^∥≤∥β∗∥ f(β^)≤f(β∗) f(β^)<f(β∗) β∗ P2 β = β *f(β^)=f(β∗) então , pois assumimos que a solução era única.β^=β∗
No entanto, pode ser que o Lasso tenha várias soluções. Pelo lema 1 de arxiv.org/pdf/1206.0313.pdf , sabemos que todas essas soluções têm o mesmo -norm (e o mesmo valor mínimo, é claro). Definimos essa norma como a restrição para o e prosseguimos.P 1ℓ1 P1
Vamos denotar por o conjunto de soluções para , com . Vamos ter uma solução, . Então, nós temos esse e, por conseguinte, . Se para alguns (e, portanto, para todos eles), então , o que contradiz nossas suposições. Se para alguns então não é o conjunto de soluções paraP 2 ‖ β ‖ =S P2 P 1 β ∉ S ‖ β ‖ ≤ ‖ β ‖ ∀ β ∈ S f ( β ) ≤ f ( β ) ∀ β ∈ S f ( β ) = f ( β ) β ∈ S β ∈ S∥β∥=b ∀β∈S P1 β^∉S ∥β^∥≤∥β∥∀β∈S f(β^)≤f(β)∀β∈S f(β^)=f(β) β∈S β^∈S β ∈ S S P 2 P 1 S P 1 P 2f(β^)<f(β) β∈S S P2 . Portanto, toda solução para está em , ou seja, qualquer solução para também é uma solução para . Resta provar que o complementar também se aplica.P1 S P1 P2
fonte