Encontrei definições possivelmente conflitantes para a estatística de validação cruzada (CV) e para a estatística de validação cruzada generalizada (GCV) associada a um modelo linear (com um vetor de erro normal e homoscedástico \ símbolo de negrito \ varepsilon ).
Por um lado, Golub, Heath & Wahba definem a estimativa GCV como (p. 216)
o minimizador de fornecido por
onde
Por outro lado, Efron define o mesmo conceito que (p. 24), mas atribui a introdução desse conceito a Craven & Wahba, onde sua definição (p. 377) é essencialmente a mesma como a definição acima mencionada de Golub, Heath & Wahba.
Isso significa que minimiza ?
Da mesma forma, Golub, Heath & Wahba definem a estimativa CV de (p. 217) como o minimizador de
onde é a estimativa
de com o ésimo ponto de dados omitido.
Os autores atribuem a introdução da estimativa CV (também chamada de estimativa PRESS) a Allen ("Allen's PRESS", ibid.) No entanto, no artigo de Allen, a estimativa PRESS é definida (p. 126) como (no artigo de Efron, é definido como (p. 24)).
Novamente, isso significa que minimiza ?
Allen, David M. A relação entre seleção de variáveis e documentação de dados e um método para previsão. Technometrics, vol. 16, nº 1 (fevereiro de 1974), pp. 125-127
Craven, Peter e Wahba, Grace. Suavização de dados ruidosos com funções de spline. Numerische Mathematik 31, (1979), pp. 377-403
Efron, Bradley. Quão tendenciosa é a taxa de erro aparente de uma regressão logística? Relatório técnico no. 232. Departamento de Estatística, Universidade de Stanford (abril de 1985)
Golub, Gene H., Heath e Grace Wahba. Validação cruzada generalizada como método para escolher um bom parâmetro de cume. Technometrics, vol. 21, No. 2 (maio de 1979), pp. 215-223
fonte
Respostas:
Eu acredito que os comentários estão apontando para a resposta, mas não afirmando isso sem rodeios. Então eu vou ser franco.
A fórmula V citada aqui é específica para a regressão linear de crista. Eles não dizem que é o mesmo que o PRESS, dizem que é uma versão do PRESS invariável à rotação. A parte "invariável à rotação" é o que torna isso generalizado.
O artigo de Efron é sobre regressão logística, personalizada para esse contexto. Se você quiser ver a tradução matemática entre os dois contextos, o livro certo para ler é Elements of Statistical Learning, 2ed, de Hastie, Tibshirani e Freedman. Eles oferecem esse livro gratuitamente, on-line: https://web.stanford.edu/~hastie/Papers/ESLII.pdf . Outra leitura útil sobre o GCV é o Generalized Additive Models, de Simon Wood. Seu tratamento integra o GCV em geral com aplicações em regressão e regressão logística.
Se você olhar o livro de ESL, p 244, verá basicamente a mesma simbologia. Eles se referem àquele produto de matriz grande que você tem como matriz mais suave (eu diria que é uma matriz Hat ou primo próximo). Eles descrevem o suave como o mapeamento de paraS yy y^
Eles oferecem uma fórmula para a aproximação do GCV:
Esse comportamento é bastante semelhante ao da AIC em muitos modelos. O é o número efetivo de parâmetros.t r a c e S
O peça você cita é mais geralmente um traço de . Até onde eu entendo, no resumo o GCV é uma versão aproximada de deixar de fora uma validação cruzada, mas em alguns casos (acredito que a regressão de cordilheira) é exata. Esse é um ponto principal no jornal Golub.n λ S
Boa sorte, escreva de volta se você aprender mais.
fonte