Entretanto, o glmnet
artigo subsequente Friedman, Hastie e Tibshirani (2010) Os caminhos de regularização para modelos lineares generalizados via descida de coordenadas não usaram esse redimensionamento e apenas tiveram uma breve nota de rodapé dizendo
Zou e Hastie (2005) chamaram essa penalidade de rede elástica ingênua e preferiram uma versão redimensionada que eles chamaram de rede elástica. Abandonamos essa distinção aqui.
Nenhuma explicação adicional é dada lá (ou em qualquer livro didático de Hastie et al.). Acho isso um pouco intrigante. Os autores deixaram o reescalonamento por considerá-lo ad hoc demais ? porque teve um desempenho pior em alguns outros experimentos? porque não ficou claro como generalizá-lo para o caso GLM? Eu não faço ideia. Mas, de qualquer forma, o glmnet
pacote se tornou muito popular desde então e, portanto, minha impressão é que hoje em dia ninguém está usando o reescalonamento da Zou & Hastie, e a maioria das pessoas provavelmente nem está ciente dessa possibilidade.
Pergunta: afinal, isso foi reescalonar uma boa ou má idéia?
Com a glmnet
parametrização, o redimensionamento de Zou & Hastie deve ser
fonte
glmnet
código. Ele não está disponível lá, mesmo como um recurso opcional (o código anterior que acompanha o artigo de 2005 obviamente suporta o redimensionamento).Respostas:
Enviei esta pergunta por e-mail para Zou e Hastie e recebi a seguinte resposta de Hastie (espero que ele não se importe em citá-la aqui):
Interpreto essas palavras como um endosso de alguma forma de "redimensionamento" da solução de rede elástica de baunilha, mas Hastie não parece mais sustentar a abordagem específica apresentada em Zou & Hastie 2005.
A seguir, revisarei e compararei brevemente várias opções de redimensionamento.
Vou usar
glmnet
parametrização da perdaO laço relaxado mencionado no email de Hastie citado acima é uma sugestão para executar outro laço no subconjunto de preditores selecionados pelo primeiro laço. A idéia é usar duas penalidades diferentes e selecionar ambas por meio de validação cruzada. Pode-se aplicar a mesma idéia à rede elástica, mas isso parece exigir quatro parâmetros de regularização diferentes e ajustá-los é um pesadelo.
Portanto, pelo menos nesses dados, todas as três abordagens superam o estimador de rede elástica de baunilha e a "rede elástica relaxada" apresenta o melhor desempenho.
fonte