No livro de Goodfellow (2016) sobre aprendizado profundo, ele falou sobre a equivalência da parada antecipada à regularização de L2 ( https://www.deeplearningbook.org/contents/regularization.html página 247).
A aproximação quadrática da função de custo é dada por:
onde é a matriz hessiana (Eq. 7.33). Isso está faltando no meio termo? A expansão de Taylor deve ser: