Ao usar o CV com dobra k para selecionar entre os modelos de regressão, geralmente calculo o erro CV separadamente para cada modelo, juntamente com o erro padrão SE, e seleciono o modelo mais simples dentro de 1 SE do modelo com o menor erro CV (o 1 regra de erro padrão, veja, por exemplo, aqui ). No entanto, recentemente me disseram que dessa maneira estou superestimando a variabilidade e que, no caso específico de selecionar entre dois modelos A e B, devo realmente proceder de uma maneira diferente:
- Para cada dobra de comprimento N K , calcule as diferenças de ponto entre as previsões dos dois modelos. Depois, calcule a diferença quadrada média da dobra M S D K = √
- média entre dobras, como de costume, e use esse erro de diferença de CV (junto com seu erro padrão) como um estimador para o erro de generalização.
Questões:
- Isso faz sentido para você? Eu sei que existem razões teóricas por trás do uso do erro CV como um estimador de erro de generalização (não sei quais são essas razões, mas sei que elas existem!). Não tenho idéia se existem razões teóricas por trás do uso desse erro CV "diferença".
- Não sei se isso pode ser generalizado para as comparações de mais de dois modelos. Computar as diferenças para todos os pares de modelos parece arriscado (múltiplas comparações?): O que você faria se tivesse mais de dois modelos?
EDIT: minha fórmula está totalmente errada, a métrica correta é descrita aqui e é muito mais complicada. Bem, estou feliz por ter perguntado aqui antes de aplicar cegamente a fórmula! Agradeço à @Bay por me ajudar a entender com sua resposta esclarecedora. A medida correta descrita é bastante experimental, por isso vou me ater ao meu cavalo de trabalho confiável, o erro do CV!