Como o ruído afeta a generalização?

Aumentar o ruído nos dados ajuda a melhorar a capacidade de aprendizado de uma rede? Faz alguma diferença ou depende do problema que está sendo resolvido? Como isso afeta o processo de generalização em