Estou regredindo um preditor contínuo em mais de 60 variáveis (contínuas e categóricas) usando o LASSO (glmnet).
Ao examinar o gráfico de rastreamento de variáveis, noto que, à medida que o log lambda aumenta, uma das principais variáveis tem um coeficiente que realmente aumenta. Depois de um certo ponto, começa a diminuir como esperávamos.
Para garantir que isso não acontecesse, eu corri 10 modelos usando bootstraps e obtive resultados muito semelhantes.
Isso é possível ou há algum problema com os dados? Se legítimo, o que essa tendência no coeficiente da variável nos diz sobre a variável e a relação com a resposta?
fonte