Li em vários lugares que R Squared não é uma medida ideal quando um modelo é adequado usando o LASSO. No entanto, não estou claro exatamente por que isso acontece.
Além disso, você poderia recomendar a melhor alternativa?
Li em vários lugares que R Squared não é uma medida ideal quando um modelo é adequado usando o LASSO. No entanto, não estou claro exatamente por que isso acontece.
Além disso, você poderia recomendar a melhor alternativa?
O objetivo de usar o LASSO é obter uma representação esparsa (de uma quantidade prevista) no sentido de não ter muitas covariáveis. Comparando modelos com tende a favorecer modelos com lotes de co-variáveis: de fato, acrescentando co-variáveis não relacionadas com o resultado nunca vai diminuir R 2 e quase sempre aumenta-lo pelo menos um pouco. O modelo LASSO irá identificar o modelo com o óptimo penalizado de probabilidade logarítmica (um log-probabilidade unpenalized é monotonicamente relacionada com o R 2 ). Estatística de validação que são mais amplamente usados para comparar modelos laço para outros tipos de modelos são, por exemplo, o BIC ou cross-validado R 2 .