A divisão de validação na função de ajuste do modelo sequencial Keras está documentada da seguinte maneira em https://keras.io/models/sequential/ :
validation_split: flutua entre 0 e 1. Fração dos dados de treinamento a serem usados como dados de validação. O modelo separará essa fração dos dados de treinamento, não treinará nele e avaliará a perda e quaisquer métricas de modelo nesses dados no final de cada época. Os dados de validação são selecionados das últimas amostras nos dados x e y fornecidos, antes da reprodução aleatória.
Observe a última linha:
Os dados de validação são selecionados das últimas amostras nos dados x e y fornecidos, antes da reprodução aleatória.
Isso significa que os dados de validação são sempre fixos e retirados da parte inferior do conjunto de dados principal?
Existe alguma maneira de selecionar aleatoriamente uma fração de dados do conjunto de dados principal?
fonte
train_test_split
e agora você confirma que este é um método melhor, pois ele obterá aleatoriamente dados de teste / validação do conjunto de dados.shuffle
parâmetro, também usariashuffle
no.fit
modelo para um keras?