Estive recentemente em algumas conversas sobre estatísticas sobre o Lasso (regularização) e um ponto que continua surgindo é que não entendemos realmente por que o Lasso funciona ou por que funciona tão bem. Gostaria de saber a que esta declaração se refere. Obviamente, eu entendo por que o Lasso funciona tecnicamente, como forma de evitar ajustes excessivos por encolhimento de parâmetros, mas estou me perguntando se existe um significado mais profundo por trás dessa declaração. Alguém tem alguma idéia? Obrigado!
machine-learning
lasso
regularization
user321627
fonte
fonte
Respostas:
Às vezes, há uma falta de comunicação entre os estatísticos que trabalham e a comunidade da teoria da aprendizagem que estuda os fundamentos de métodos como o laço. As propriedades teóricas do laço são realmente muito bem compreendidas.
Este documento tem um resumo na Seção 4 de muitas das propriedades que ele desfruta. Os resultados são bastante técnicos, mas essencialmente:
fonte
Se, ao entender por que o Lasso funciona, você quer dizer por que ele realiza a seleção de recursos (ou seja, definir pesos para alguns recursos exatamente como 0), entendemos isso muito bem:
fonte
Há o problema da recuperação de sinal da consistência de seleção de modelo (que foi respondida por estatísticos ) e
existe o problema da inferência (construção de bons intervalos de confiança para as estimativas), que é um tópico de pesquisa.
A maior parte do trabalho é feita por estatísticos, e não "pela comunidade da teoria da aprendizagem".
fonte