Atualmente, estou trabalhando na construção de um modelo preditivo para um resultado binário em um conjunto de dados com ~ 300 variáveis e 800 observações. Eu li muito neste site sobre os problemas associados à regressão gradual e por que não usá-la.
Eu estive lendo a regressão do LASSO e sua capacidade de seleção de recursos e tive sucesso em implementá-la com o uso do pacote "caret" e "glmnet".
Sou capaz de extrair o coeficiente do modelo com o ideal lambda
e alpha
do "sinal de intercalação"; no entanto, não estou familiarizado com como interpretar os coeficientes.
- Os coeficientes do LASSO são interpretados no mesmo método da regressão logística?
- Seria apropriado usar os recursos selecionados no LASSO na regressão logística?
EDITAR
Interpretação dos coeficientes, como nos coeficientes exponenciados da regressão do LASSO, pois o log tem chances de uma alteração de 1 unidade no coeficiente, mantendo todos os outros coeficientes constantes.
fonte
Respostas:
Permitam-me reformular: os coeficientes do LASSO são interpretados da mesma maneira que, por exemplo, os coeficientes de probabilidade máxima do
OLSem uma regressão logística?O LASSO (um método de estimativa penalizada) visa estimar as mesmas quantidades (coeficientes do modelo) que, digamos, a máxima verossimilhança do
OLS(um método não compensado). O modelo é o mesmo e a interpretação permanece a mesma. Os valores numéricos do LASSO normalmente diferem dos da probabilidade máxima doOLS: alguns estarão mais próximos de zero, outros serão exatamente zero. Se uma quantidade sensata de penalização tiver sido aplicada, as estimativas do LASSO ficarão mais próximas dos valores verdadeiros do que as estimativas de máxima verossimilhança doOLS, que é um resultado desejável.Não há nenhum problema inerente a isso, mas você pode usar o LASSO não apenas para seleção de recursos, mas também para estimativa de coeficientes. Como mencionei acima, as estimativas do LASSO podem ser mais precisas do que, digamos, as estimativas de máxima verossimilhança do
OLS.fonte