Métodos de re-amostragem de sinal de intercalação

20

Estou usando a biblioteca caretem R para testar vários procedimentos de modelagem.

O trainControlobjeto permite especificar um método de re-amostragem. Os métodos são descritos na documentação secção de 2,3 e incluem: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Embora alguns deles sejam fáceis de inferir, nem todos esses métodos estão claramente definidos.

Quais são os procedimentos correspondentes a esses métodos de reamostragem?

Ram Ahluwalia
fonte
link da documentação está quebrado. Use isso em seu lugar.
vikas

Respostas:

20

Ok, aqui está a minha tentativa:

  • boot - bootstrap
  • boot632 - 0.632 bootstrap
  • cv - validação cruzada, provavelmente isso se refere à validação cruzada em K-fold .
  • LOOCV - validação cruzada de exclusão única, também conhecida como jacknife.
  • LGOCV - validação cruzada de grupo excluído, variante de LOOCV para dados hierárquicos.
  • repeatcv - é provavelmente repetida validação aleatória de subamostragem , ou seja, a divisão para treinar e testar os dados é feita de maneira aleatória.
  • oob - refere-se à estimativa out-of-bag proposta por Breiman , que ainda está relacionada à agregação de bootstrap . (O arquivo no link não é um arquivo ps, mas um arquivo ps.Z, renomeie-o e tente abrir.)
mpiktas
fonte
1
Acredito que LGOCV é uma divisão aleatória entre um conjunto de treinamento e um conjunto de validação, repetidos n vezes. Portanto, em vez do caso comum de dividir dados entre trem e espera (construir modelo no trem e validar na espera) uma vez, esse processo é repetido várias vezes.
B_Miner
3
Eu também acredito que o CV repetido é a validação cruzada k-fold, feita várias vezes.
B_Miner
Difícil de acreditar que isso não esteja documentado em algum lugar.
andrew
4

A repeatedcvvalidação cruzada é repetida em 10 vezes, com certeza, de acordo com a apresentação de Max Kuhn. O esquema de reamostragem padrão é a autoinicialização.

Um bom arquivo que você pode consultar sobre os métodos de reamostragem é a Predictive Modeling with R e o pacote de intercalação ( pdf ). Max apresentou isso em "useR! 2013".

tigergopro
fonte