Quem inventou a validação cruzada k-fold?

24

Estou procurando uma referência ao artigo em que a validação cruzada da dobra k foi introduzida (em vez de apenas uma boa referência acadêmica para o assunto). Talvez esteja muito longe nas brumas do tempo identificar inequivocamente o primeiro artigo, de modo que qualquer artigo inicial em que a idéia foi usada seria interessante.

Os primeiros que eu conheço são

PA Lachenbruch e MR Mickey, "Estimativa das taxas de erro na análise discriminante", Technometrics, vol. 10, n. 1, pp. 1–12, fevereiro de 1968.

e

A. Luntz e V. Brailovsky, “Na estimativa de caracteres obtidos no procedimento estatístico de reconhecimento (em russo)”, Techicheskaya Kibernetica, vol. 3, 1969.

mas, até onde eu sei, eles abrangem apenas a validação cruzada de deixar um para fora (meu russo técnico não é tudo o que poderia ser; o).

Dikran Marsupial
fonte
11
Presumo que você esteja familiarizado com a lei de Stigler ? (Para ser interpretado um pouco mais ampla do que como afirmado.) :)
cardinal
Eu aprendo algo novo todos os dias! Uma referência inicial será feita se o inventor original for desconhecido. Eu suspeito que é uma daquelas coisas que foi inventada independentemente várias vezes, mas a história é interessante.
Dikran marsupiais

Respostas:

12

Um artigo que pode valer a pena consultar é

Stone M. Escolha de validação cruzada e avaliação de previsões estatísticas. J. Royal Stat. Soc., 36 (2), 111-147, 1974.

Eu vi referências a

Mosteller F. e Tukey JW Análise de dados, incluindo estatísticas. No Manual de Psicologia Social. Addison-Wesley, Reading, MA, 1968.

k

O artigo de 1931

Larson S. O encolhimento do coeficiente de correlação múltipla. J. Educat. Psychol., 22: 45-55, 1931.

é mencionado, por exemplo, por Stone, como um exemplo inicial em que um conjunto de validação selecionado aleatoriamente é deixado de lado para posterior avaliação do modelo.

NRH
fonte
A referência Mosteller e Tukey parece um bom começo +1 (eu presumo que é Tukey ao invés de Turquia;! O)
Dikran Marsupial
@DikranMarsupial, Ha, pede desculpas a Tukey. Eu colei a referência e não notei o nome com erro de ortografia. Sim, é definitivamente Tukey.
NRH 19/04
11
Mosteller e Tukey: books.google.pl/…
liori 23/03