De Uma Introdução à Aprendizagem Estatística de James et al., A estimativa de validação cruzada de saída única (LOOCV) é definida por que .
Sem prova, a equação (5.2) afirma que, para mínimos quadrados ou regressão polinomial (se isso se aplica à regressão em apenas uma variável é desconhecida para mim), onde " está o o valor ajustado do ajuste dos mínimos quadrados originais ( não faço ideia do que isso significa, a propósito , significa usar todos os pontos no conjunto de dados?) e é a alavancagem "definida poryii
Como alguém prova isso?
Minha tentativa: pode-se começar observando que mas separados disso (e se bem me lembro, essa fórmula para é verdadeira apenas para regressão linear simples ...), não tenho certeza de como proceder a partir daqui.hi
fonte
Respostas:
Mostrarei o resultado para qualquer regressão linear múltipla, independentemente de os regressores serem polinômios de . De fato, mostra um pouco mais do que você solicitou, porque mostra que cada residual LOOCV é idêntico ao resíduo ponderado por alavancagem correspondente da regressão completa, não apenas que você pode obter o erro LOOCV como em (5.2) (existe pode haver outras maneiras pelas quais as médias concordam, mesmo que nem cada termo na média seja o mesmo).Xt
Deixe-me tomar a liberdade de usar notação ligeiramente adaptada.
Primeiro mostramos que onde é a estimativa usando todos os dados e a estimativa ao deixar de fora , observação . Seja definido como um vetor de linha tal que . são os resíduos.(A) β β (t)X(t)tXt y t=Xt β u t
A prova usa o seguinte resultado algébrico da matriz.
Seja uma matriz não singular, um vetor e um escalar. Se Então b λ λUMA b λ (A+λbb′)-1
A prova de (B) segue imediatamente da verificação
O seguinte resultado é útil para provar (A)
Prova de (C): Por (B), temos, usando , Então, encontramos∑Tt = 1X′tXt= X′X (X ′ (
A prova de (A) agora segue de (C): Como , temos ou Então, em que a última igualdade segue de (C).( X ' ( t ) X ( t ) + X ' t X t ) β
Agora, observe . Multiplique em (A) por , adicione em ambos os lados e reorganize para obter, com os resíduos resultantes do uso de ( ), ouht= Xt( X′X)- 1X′t Xt yt você^( T ) β^( T ) yt- Xtβ^( T )
fonte