Pergunta muito básica aqui, mas eu gostaria de entender (não matematicamente) como o fato de adicionar uma "penalidade" (soma do coeficiente ao quadrado. Vezes um escalar) à soma residual do quadrado pode reduzir grandes coeficientes? obrigado !
7
Respostas:
Como sua representação "penalizada" do problema de minimização é apenas a forma de intervalo de um problema de otimização de restrição:
Suponha variáveis centralizadas. Em ambos os casos, laço e cordilheira, sua função de destino irrestrita é a soma usual de resíduos quadrados; ou seja, dadop regressores que você minimiza:
over all .
Agora, no caso de uma regressão de cume, você minimiza o modo que por algum valor de . Para valores pequenos de , será impossível derivar a mesma solução que no cenário quadrado mínimo padrão; nesse caso, você apenas minimiza o - Pense em seguida, em somente a solução possível pode ser .RSS(β)
Por outro lado, no caso do laço, você minimiza o sob a restrição para algum valor de .RSS(β)
Ambos os problemas de otimização restritos podem ser equivalentemente forumlated em termos de um problema de otimização irrestrito, ou seja, para o laço: você pode minimizar de forma equivalente
fonte