Quando eu determino meu lambda através da validação cruzada, todos os coeficientes se tornam zero. Mas tenho algumas dicas da literatura de que alguns dos preditores devem definitivamente afetar o resultado. É besteira escolher arbitrariamente lambda para que haja a escassez que se deseja?
Quero selecionar os 10 principais preditores dentre 135 para um modelo cox e, infelizmente, os tamanhos de efeito são pequenos.
Respostas:
fonte
Existe uma boa maneira de executar o LASSO, mas use um número fixo de preditores. É a regressão de menor ângulo (LAR ou LARS) descrita no artigo de Efron. Durante o procedimento iterativo, ele cria vários modelos lineares, cada novo possui mais um preditor, para que você possa selecionar um com o número desejado de preditores.
fonte
A teoria do laço depende do parâmetro de regularização ser suficientemente grande para tornar o modelo selecionado suficientemente escasso. Pode ser que seus 10 recursos sejam muitos ou muito poucos, pois não é trivial transformar um limite inferior em em um limite superior em.λ λ |S∗|
Seja nossa estimativa baseada em dados para e coloque . Então, talvez você esteja tentando garantir que possa recuperar pelo menos os recursos relevantes? Ou talvez você esteja tentando estabelecer esse para saber que os recursos encontrados valem a pena? Nesses casos, seu procedimento seria mais justificado se você tivesse informações anteriores sobre os tamanhos relativos de .β^ β∗ S^={j:β^j≠0} S∗⊆S^ S^⊆S∗ S∗
Além disso, observe que você pode deixar alguns coeficientes sem compensação ao executar o laço, por exemplo
glmnet
.fonte