Com base no que aprendi, usamos vários filtros em uma camada Conv de uma CNN para aprender diferentes detectores de recursos. Mas como esses filtros são aplicados de maneira semelhante (ou seja, deslizados e multiplicados pelas regiões da entrada), eles não aprenderiam os mesmos parâmetros durante o treinamento? Portanto, o uso de vários filtros seria redundante?
11
Encontrei a resposta para esta pergunta: https://www.quora.com/Why-does-each-filter-learn-different-features-in-a-convolutional-neural-network
Ele diz aqui: "... O algoritmo (de otimização) descobre que a perda não diminui se dois filtros tiverem pesos e desvios semelhantes; portanto, eventualmente mudará um dos filtros (pesos e desvios) para reduzir a perda. aprendendo um novo recurso ".
Obrigado pelas respostas. Aprecie :)
fonte