O livro Elements of Statistical Learning (disponível em PDF online) discute o viés otimista (7.21, página 229). Ele afirma que o viés de otimismo é a diferença entre o erro de treinamento e o erro dentro da amostra (erro observado se coletarmos novos valores de resultado em cada um dos pontos de treinamento originais) (conforme abaixo).
Em seguida, ele afirma que esse viés de otimismo ( ) é igual à covariância de nossos valores estimados de y e dos valores reais de y (fórmula abaixo). Tenho problemas para entender por que essa fórmula indica o viés do otimismo; ingenuamente, eu pensaria que uma forte covariância entre atual e previsto apenas descreve precisão - não otimismo. Deixe-me saber se alguém pode ajudar com a derivação da fórmula ou compartilhar a intuição.
fonte
Respostas:
Vamos começar com a intuição.
Não há nada de errado em usar para prever y i . De fato, não usá-lo significaria que estamos descartando informações valiosas. No entanto, o mais que nós dependem nas informações contidas no y i para chegar a nossa previsão, mais excessivamente otimista nosso estimador será.yEu y^Eu yEu
Confira esta bela apostila de Ryan Tibshirani para mais detalhes sobre essa intuição
Agora, uma prova semelhante à outra resposta, mas com um pouco mais de explicação
Lembre-se de que, por definição, o otimismo médio é:
Agora use uma função de perda quadrática e expanda os termos do quadrado:
fonte
fonte