As redes neurais convolucionais mais comuns contêm camadas de pooling para reduzir as dimensões dos recursos de saída. Por que não consegui a mesma coisa simplesmente aumentando o passo da camada convolucional? O que torna a camada de pool necessária?
fonte
Aparentemente, o pool máximo ajuda porque extrai os recursos mais nítidos de uma imagem. Portanto, dada uma imagem, os recursos mais nítidos são a melhor representação de nível inferior de uma imagem. https://www.quora.com/What-is-the-benefit-of-using-average-ousing-rather-than-max-ousing
Mas, de acordo com a palestra Deep Learning de Andrew Ng, o pool máximo funciona bem, mas ninguém sabe o porquê. Citação -> "Mas eu tenho que admitir, acho que a principal razão pela qual as pessoas usam o pool máximo é porque foi encontrado em muitos experimentos para funcionar bem ... Não sei se alguém sabe completamente se esse é o verdadeiro razão subjacente ".
fonte