Eu tenho uma pergunta sobre o processo de validação cruzada. Estou no meio de um curso de Machine Learning no Cursera. Um dos tópicos é sobre a validação cruzada. Achei um pouco difícil de seguir. Eu sei por que precisamos do CV porque queremos que nossos modelos funcionem bem em dados futuros (desconhecidos) e o CV evita o ajuste excessivo. No entanto, o próprio processo é confuso.
O que entendi é que divido os dados em três subconjuntos: treinamento, validação e teste. Treinar e validar é encontrar a complexidade ideal de um modelo. O que eu não entendo é o terceiro subconjunto. Entendo que pego vários recursos para o modelo, treino e valido no subconjunto Validação e procuro a Função de Custo mínima quando altero a estrutura. Quando o encontrei, testo o modelo no subconjunto Teste. Se eu já encontrei a função de custo mínimo no subconjunto de validação, por que precisaria testá-lo novamente no subconjunto de teste ???
Alguém poderia esclarecer isso para mim?
Obrigado
Respostas:
fonte
Devido a um erro aleatório: geralmente você tem apenas um número finito de casos.
A otimização do desempenho da validação (teste interno) significa que você pode estar adaptando-se a esse conjunto de testes interno. O conjunto de testes internos contribui para a estimativa do modelo final e, portanto, não é independente do modelo.
Isso significa que você precisa ter outro conjunto de testes (externo) independente de todo o procedimento de modelagem (incluindo todos os processos de otimização e pré-processamento orientado a dados ou de seleção de modelos) se desejar estimar as propriedades de generalização.
Eu recomendo que você faça uma simulação e compare as três estimativas de erro diferentes que você pode ter
mede a qualidade do ajuste
Em uma simulação, você pode compará-los facilmente também com um conjunto de testes adequado, grande e gerado de forma independente. Se a configuração estiver correta, o teste externo deve ser imparcial (com base no modelo substituto que avalia, não com um modelo "final" construído em todo o conjunto de dados). O teste interno geralmente é tendenciosamente otimista, e a re-substituição é ainda mais otimista.
No meu campo, o teste interno subestimaria facilmente o erro de generalização por um fator de 2 a 5 (muito mais para esquemas de otimização agressivos).
Nota: a nomenclatura dos conjuntos não é universal. No meu campo (química analítica), a validação geralmente significaria a prova do desempenho do procedimento final - portanto, mais o que o seu conjunto de "testes" faz do que o seu conjunto de "validação".
Portanto, prefiro falar dos conjuntos de testes internos e externos ou do conjunto de testes de otimização (= conjunto de testes interno) e, em seguida, o conjunto de validação significaria o conjunto de testes externo.
fonte
Durante o treinamento do modelo, é necessário selecionar metametros para o modelo (por exemplo, parâmetro de regularização) ou até escolher entre vários modelos. Nesse caso, o subconjunto de validação é usado para a escolha de parâmetros, mas o subconjunto de teste para a estimativa de previsão final.
fonte