aumento de dados ao usar flow_from_directory na CNN

7

Eu quero usar um pequeno conjunto de dados para criar o modelo CNN. Então, eu estou usando o aumento de dados para aumentar o conjunto de dados do trem. Devo usar todas as técnicas de aumento (argumentos) listadas aqui ?

Percebi que adicionar muitos argumentos diminui a precisão do modelo e dificulta o conjunto de treinamento do que o conjunto de testes.

Quais são as melhores práticas para usar o aumento de dados quando usar flow_from_directory?

Noran
fonte

Respostas:

6

As melhorias geralmente dependem da natureza dos seus dados. Imagine se o resultado de um aumento fosse lógico no seu contexto.

Por exemplo, digamos que você tenha um conjunto de dados gatos versus cães. As imagens aqui podem ser viradas da esquerda para a direita. Por outro lado, no conjunto de dados MNIST, não faz sentido inverter as imagens (de que serviria um '3' invertido para o seu modelo). Algumas melhorias podem realmente confundir o modelo (por exemplo, um '9' invertido pode parecer um '6').

Além disso, se a ampliação está piorando o modelo, tente ampliações menores (por exemplo, atenha-se a transformações afins com intervalos pequenos - rotação / translação / dimensionamento).[5

ILM91
fonte