Suponha que eu tenha dados longitudinais da forma (eu tenho várias observações, essa é apenas a forma de uma única). Estou interessado em restrições sobre Σ . Um irrestrita Σ é equivalente a Y j = α j + j - 1 Σ ℓ = 1 & Phi; ℓ j Y j - ℓ + ε j
Isto geralmente não é feito, uma vez que requer a estimativa os parâmetros de covariância. Um modelo é "lag- k " se tomarmos Y j = α j + k Σ ℓ = 1 & Phi; ℓ j Y j - ℓ + ε j , ou seja, só usamos os anteriores k termos de prever Y j a partir da história.
O que eu realmente gostaria de fazer é usar algum tipo de ideia encolhimento a zero fora algum do , como o laço. Mas a coisa é, eu também gostaria que o método que eu uso a preferir modelos que são lag- k para alguns k ; Eu gostaria de penalizar as defasagens de ordem superior mais do que as de ordem inferior. Eu acho que isso é algo que gostaríamos de fazer particularmente, uma vez que os preditores são altamente correlacionados.
Uma questão adicional é que, se (digamos) for reduzido para 0, eu também gostaria que ϕ 36 seja reduzido para 0 , ou seja, o mesmo atraso é usado em todas as distribuições condicionais.
Isso atinge o segundo objetivo de zerar os coeficientes para atrasos de ordem superior, mas é mais restritivo do que a única restrição de se preferir um modelo de menor atraso. E, como outros apontam, essa é uma restrição pesada que pode ser muito difícil de justificar.
Tendo dispensado as ressalvas, o artigo apresenta os resultados do método em dados de séries temporais reais e simulados e detalha algoritmos para encontrar os coeficientes. A conclusão menciona um pacote R, mas o artigo é bastante recente e uma pesquisa no CRAN por "LASSO ordenado" aparece vazia, então eu suspeito que o pacote ainda esteja em desenvolvimento.
O artigo também oferece uma abordagem generalizada na qual dois parâmetros de regularização "incentivam a quase monotonicidade". (Veja a p. 6.) Em outras palavras, deve-se conseguir ajustar os parâmetros para permitir uma ordem mais relaxada. Infelizmente, nem exemplos nem comparações do método relaxado são fornecidos. Mas, os autores escrevem que implementar essa alteração é uma simples questão de substituir um algoritmo por outro, portanto, espera-se que faça parte do próximo pacote R.
fonte
A penalidade aninhada do LASSO ( pdf ) pode ser empregada, mas não há pacotes R para ela.
fonte
Eu sei que você o escreveu como premissa, mas eu não usaria o LASSO ordenado sem ter certeza absoluta de que isso é necessário, porque as suposições do LASSO ordenado não são diretamente apropriadas para a previsão de séries temporais. Como um contra-exemplo, considere o caso em que você tem um atraso de, digamos, dez intervalos de tempo entre a medição e o alvo. Obviamente, as restrições ordenadas do LASSO não podem lidar com esses efeitos sem atribuir bobagens aos nove primeiros parâmetros.
fonte