Estou ciente do tipo de regularização LASSO, cume e rede elástica em modelos de regressão linear.
Questão:
- Esse tipo de estimativa penalizada (ou similar) pode ser aplicada à modelagem ARIMA (com uma parte MA não vazia)?
q ⩽ q m um x
Minhas perguntas adicionais são:
- Poderíamos incluir todos os termos até ( , ), mas penalizar o tamanho dos coeficientes (potencialmente até zero)? Isso faria sentido? q m a x
- Se fosse, isso foi implementado no R ou em outro software? Se não, qual foi o problema?
Um post um pouco relacionado pode ser encontrado aqui .
time-series
arima
lasso
regularization
ridge-regression
Richard Hardy
fonte
fonte
Respostas:
Resposta à pergunta 1.
Chen & Chan "Seleção do subconjunto ARMA via Lasso adaptável" (2011) * usa uma solução alternativa para evitar a estimativa de probabilidade máxima máxima exigida computacionalmente. Citando o jornal, eles
Opcionalmente, eles sugerem a estimativa de probabilidade máxima e o diagnóstico de modelo para o (s) modelo (s) de subconjunto selecionado (s) ARMA.
Wilms et al. "A identificação esparsa e a estimativa de médias móveis auto-regressivas de vetor de alta dimensão" (2017) fazem ainda mais do que eu pedi. Em vez de um modelo ARIMA univariado, eles pegam um vetor ARMA (VARMA) em altas dimensões e usam uma penalidade para estimativa e seleção de ordem de atraso. Eles apresentam o algoritmo de estimação e desenvolvem alguns resultados assintóticos.L1
Em particular, eles empregam um procedimento de duas etapas. Considere-se um modelo VARMA que tem de ser estimada, mas a ordens lag p e q são uknown.
No Estágio 1, eles aproximam o modelo VARMA por um modelo VAR de alta ordem e estimam-no usando um estimador HAR-hierárquico VAR, que coloca uma penalidade hierárquica de lastro de grupo hierárquica baseada em lag nos parâmetros auto-regressivos.⌊1.5T−−√⌋ ||y−y^||F2
ε^:=y−y^
(A ordem de atraso está definida como . As equações do modelo são estimadas em conjunto e a norma de Frobenius dos erros| | y - y | | F 2 é minimizada com uma pena de grupo hierárquica-lasso sobre os coeficientes de regressão). Obtêm resíduos £ :=y - y para ser usada como substitutos para os verdadeiros erros na Fase 2.
A abordagem de Wilms et al. é implementado no pacote R "bigtime" .
Referências
* Obrigado a @hejseb pelo link.
fonte