A perda salta abruptamente quando decaimento da taxa de aprendizado com o otimizador Adam no PyTorch
Estou treinando uma auto-encoderrede com Adamotimizador (with amsgrad=True) e MSE losspara a tarefa de separação de fonte de áudio de canal único. Sempre que decai a taxa de aprendizado por um fator, a perda de rede aumenta bruscamente e depois diminui até a próxima queda na taxa de...