Ao executar a validação cruzada de dobras k, entendo que você obtém as métricas de precisão apontando todas as dobras, exceto uma nessa dobra, e fazendo previsões, e repita esse processo vezes. Você pode executar métricas de precisão em todas as suas instâncias (precisão, recall,% classificada corretamente), que devem ser as mesmas que se você as calculasse todas as vezes e calculasse a média do resultado (corrija-me se estiver errado).
O resultado final que você deseja é um modelo final.
fonte