No aprendizado de máquina básico, aprendemos as seguintes "regras práticas":
a) o tamanho dos seus dados deve ser pelo menos 10 vezes o tamanho da dimensão VC do seu conjunto de hipóteses.
b) uma rede neural com conexões N tem uma dimensão VC de aproximadamente N.
Então, quando uma rede neural de aprendizado profundo diz, milhões de unidades, isso significa que deveríamos ter, digamos, bilhões de pontos de dados? Você pode, por favor, lançar alguma luz sobre isso?
Respostas:
A regra geral de que você fala não pode ser aplicada a uma rede neural.
Uma rede neural possui alguns parâmetros básicos, como pesos e vieses. O número de pesos depende do número de conexões entre as camadas da rede e o número de vieses depende do número de neurônios.
O tamanho dos dados necessários depende muito de -
Dito isto, a maneira mais adequada e segura de saber se o modelo está sendo ajustado demais é verificar se o erro de validação está próximo do erro de treinamento. Se sim, então o modelo está funcionando bem. Caso contrário, é provável que o modelo esteja sobreajuste e isso significa que você precisa reduzir o tamanho do seu modelo ou introduzir técnicas de regularização.
fonte