Todos nós estamos familiarizados com a noção, bem documentada na literatura, de que a otimização do LASSO (por uma questão de simplicidade limita a atenção aqui ao caso da regressão linear)
é equivalente ao modelo linear com erros gaussianos no qual a os parâmetros recebem o Laplace anterior
Também sabemos que quanto mais alto o parâmetro de ajuste, , maior a parte dos parâmetros é definida como zero. Dito isto, tenho a seguinte pergunta de pensamento:
Considere que, do ponto de vista bayesiano, podemos calcular a probabilidade posterior de que, digamos, as estimativas de parâmetros diferentes de zero estejam em qualquer coleção de intervalos e os parâmetros definidos como zero pelo LASSO sejam iguais a zero. O que me confundiu é que, como o prior de Laplace é contínuo (na verdade, absolutamente contínuo), então como pode haver massa em qualquer conjunto que é produto de intervalos e singletons em ?
lasso
laplace-distribution
Grant Izmirlian
fonte
fonte
Respostas:
Como todos os comentários acima, a interpretação bayesiana do LASSO não leva o valor esperado da distribuição posterior, que é o que você gostaria de fazer se fosse um purista. Se esse fosse o caso, você estaria certo de que há uma chance muito pequena de que o posterior seja zero, dados os dados.
Na realidade, a interpretação bayesiana do LASSO está tomando o estimador MAP (Máximo A Posteriori) do posterior. Parece que você é familiar, mas para quem não é, isso é basicamente a máxima verossimilhança bayesiana, onde você usa o valor que corresponde à probabilidade máxima de ocorrência (ou o modo) como seu estimador para os parâmetros no LASSO. Como a distribuição aumenta exponencialmente até zero da direção negativa e cai exponencialmente na direção positiva, a menos que seus dados sugiram fortemente que o beta seja outro valor significativo, é provável que o valor máximo do valor de seu posterior seja 0.
Para encurtar a história, sua intuição parece basear-se na média do posterior, mas a interpretação bayesiana do LASSO baseia-se em adotar o modo do posterior.
fonte