Eu tenho a arquitetura de rede do artigo "aprendendo similaridade de imagem refinada com classificação profunda" e não consigo descobrir como a saída da rede paralela três é mesclada usando a camada de incorporação linear. A única informação fornecida nesta camada, no artigo, é
Por fim, normalizamos os encaixes das três partes e os combinamos com uma camada de encaixe linear. A dimensão da incorporação é 4096.
Alguém pode me ajudar a descobrir o que exatamente o autor quer dizer quando está falando sobre essa camada?
neural-network
deep-network
A. Sam
fonte
fonte
Respostas:
Camada de incorporação linear deve ser apenas um nome sofisticado para uma camada densa sem ativação. 'Linear' significa que não há ativação (ativação é identidade). E a incorporação é um conceito para uma representação vetorial dos dados de entrada (por exemplo, incorporação de palavras). Acredito que os elementos do segundo vetor sejam simplesmente adicionados ao primeiro em termos de elementos.
fonte
É mencionado no artigo:
Eles pegam cada parte do modelo e o normalizam separadamente.
Quanto a combiná-los, como você comentou, para capturar os recursos mais salientes, com uma representação subcompleta, não há necessidade de não linearidade.
fonte