Eu sei que a regressão linear pode ser pensada como "a linha que está verticalmente mais próxima de todos os pontos" :
Mas há outra maneira de vê-lo, visualizando o espaço da coluna, como "a projeção no espaço estendido pelas colunas da matriz do coeficiente" :
Minha pergunta é: nessas duas interpretações, o que acontece quando usamos a regressão linear penalizada, como regressão de cume e LASSO ? O que acontece com a linha na primeira interpretação? E o que acontece com a projeção na segunda interpretação?
ATUALIZAÇÃO: @JohnSmith nos comentários trouxe à tona o fato de que a penalidade ocorre no espaço dos coeficientes. Existe uma interpretação neste espaço também?
regression
intuition
geometry
Lucas Reis
fonte
fonte
Respostas:
Desculpe pelas minhas habilidades de pintura, tentarei lhe dar a seguinte intuição.
Existe um mínimo dessa função, no meio dos círculos vermelhos. E esse mínimo nos dá a solução não penalizada.
Quanto maior a penalidade, maiores os contornos azuis "mais estreitos" que obtemos e, em seguida, os gráficos se encontram em um ponto mais próximo de zero. Um vice-versa: quanto menor a penalidade, os contornos se expandem e a interseção dos gráficos em azul e vermelho se aproxima do centro do círculo vermelho (solução não penalizada).
Espero que explique alguma intuição sobre como a regressão penalizada funciona no espaço de parâmetros.
fonte
A intuição que tenho é a seguinte: No caso dos mínimos quadrados, a matriz do chapéu é uma projeção ortogonal, portanto, idempotente. No caso penalizado, a matriz do chapéu não é mais idempotente. Na verdade, aplicá-lo infinitamente várias vezes, reduzirá os coeficientes à origem. Por outro lado, os coeficientes ainda precisam estar no intervalo dos preditores, portanto ainda é uma projeção, embora não ortogonal. A magnitude do fator penalizador e o tipo de norma controlam a distância e a direção do encolhimento em direção à origem.
fonte