Como posso provar que a camada de gargalo do meu codificador automático CNN contém informações úteis?

7

Estou usando o autoencoder CNN para criar uma camada de representação de estado que mais tarde serei alimentada no meu Agente de Reforço. Então, eu treinei meu autoencoder CNN e ele está dando boas representações de estado. Mas eu tenho as seguintes perguntas,

  1. Minha camada de codificador automático pode ser super ajustada
  2. Se houver um excesso de ajuste, isso causará informações irritantes na minha camada de gargalo?
Shamane Siriwardhana
fonte

Respostas:

7

Sim para as duas perguntas. Seu codificador automático pode se ajustar demais e isso fará com que seu gargalo armazene informações inúteis (além de qualquer informação útil que ele já armazene).

Algumas maneiras de evitar isso são:

  • Encontre um conjunto de dados maior ou aumente o atual.
  • Adicione ruído à entrada (consulte Autoencoders sem ruído).
  • Regularização (por exemplo, parada antecipada, restrições de escarsidade )
cat91
fonte
existe alguma maneira de verificar? Meu codificador automático pode usar apenas o estado representado por uma imagem no simulador. Qual é apenas um cenário interno? Portanto, não há muito padrão entre estados. É cozinha, tem coisas semelhantes à cozinha. Treinar com perdas auxiliares pode ajudar a se livrar do excesso de ajuste ou não?
Shamane Siriwardhana
Além disso, o que você quer dizer com "ao lado de qualquer informação útil que ele já armazena", isto significa que, de alguma forma, reconstruir o gargalo manterá a informação útil correta? mesmo que
super
2
@ShamaneSiriwardhana Sim, se você rotulou dados, poderá ter uma saída auxiliar com uma perda auxiliar e isso ajudará o autoencoder a identificar quais elementos da imagem de entrada são necessários para a classificação. Por "informações úteis", quero dizer quaisquer relações úteis que o autoencoder conseguiu extrair e são armazenadas na camada de gargalo. Além daqueles a autoencoder pode também modelar o "ruído" no conjunto de treinamento, que é o que fará com que ele overfit
cat91