A Tabela 18.1 nos Elementos de aprendizagem estatística resume o desempenho de vários classificadores em um conjunto de dados de 14 classes. Estou comparando um novo algoritmo com o laço e a rede elástica para esses problemas de classificação em várias classes.
Usando glmnet
versão 1.5.3 (R 2.13.0) que não seja capaz de reproduzir ponto 7. (a multinominal -penalized) na tabela, em que o número de genes utilizado é referido como sendo 269 e o erro de teste é de 13 para fora de 54. Os dados usados são esse conjunto de dados de 14 micro-arranjos de câncer . O que quer que eu tenha tentado, obtenho um modelo de melhor desempenho usando cerca de 170-180 genes com um erro de teste de 16 em 54.
Observe que no início da Seção 18.3, na página 654, é descrito algum pré-processamento dos dados.
Entrei em contato com os autores - até agora sem resposta - e pergunto se alguém pode confirmar que há um problema na reprodução da tabela ou fornecer uma solução sobre como reproduzi-la.
Respostas:
você verificou o pacote R do livro? contém todos os conjuntos de dados, funções e a maioria dos scripts usados lá ...
fonte