O DeepMind afirma que sua rede Q profunda (DQN) conseguiu adaptar continuamente seu comportamento enquanto aprendia a jogar 49 jogos da Atari.
Depois de aprender todos os jogos com a mesma rede neural, o agente foi capaz de jogá-los todos nos níveis 'sobre-humanos' simultaneamente (sempre que foi apresentado aleatoriamente com um dos jogos) ou poderia ser bom apenas em um jogo por vez, porque a mudança exigiu uma reaprendizagem?
Respostas:
A troca exigiu uma reaprendizagem.
Além disso, note que :
e
fonte
A mudança requer reaprendizagem; a rede não possuía um único conjunto de pesos que permitisse executar bem todos os jogos. Isto é devido ao problema de esquecimento catastrófico.
No entanto, trabalhos recentes foram feitos para superar esse problema:
"Superando o esquecimento catastrófico nas redes neurais", 2016
Artigo: https://arxiv.org/pdf/1612.00796v1.pdf
fonte