Estou pensando em construir interfaces MATLAB e R para Ross Quinlan 's C5.0 (para aqueles que não estão familiarizados com ele, C5.0 é um pacote de algoritmo de árvore de decisão e software; uma extensão de C4.5 ), e eu estou tentando ter uma idéia dos componentes que eu precisaria escrever.
A única documentação que encontrei para o C5.0 está aqui , que é um tutorial para o See5 (uma interface do Windows para o C5.0?). O arquivo tar vem com um Makefile, mas nenhum arquivo Leiame ou qualquer documentação adicional.
Pelo que li no tutorial acima, o C5.0 usa uma representação baseada em ASCII para manipular entradas e saídas, e também estou pensando em construir uma interface que transmita dados binários diretamente entre o MATLAB ou R e C5.0. A representação de dados do C5.0 é usada por qualquer outro software de aprendizado de máquina / classificação?
Alguém já tentou criar uma interface MATLAB ou R para ID3, C4.5 ou C5.0 antes?
obrigado
fonte
Respostas:
Parece uma ótima idéia, especialmente porque a página para a qual você vincula mostra que o C5.0 agora está sob GPL.
Tenho alguma experiência em agrupar o software C / C ++ para R usando Rcpp ; Eu ficaria feliz em ajudar.
fonte
A interface do código C / C ++ para o MATLAB é bastante direta, tudo o que você precisa fazer é criar uma função de gateway MEX para lidar com a conversão de parâmetros e os parâmetros de retorno. Tenho experiência em criar arquivos MEX para fazer esse tipo de coisa e ficaria feliz em ajudar.
fonte
ATUALIZAR:
Agora no CRAN:
http://cran.r-project.org/web/packages/C50/index.html
ORIGINAL:
Estamos trabalhando nisso há algum tempo (começando com o Cubist e depois trabalhando no C5.0).
Se você deseja contribuir:
https://r-forge.r-project.org/projects/rulebasedmodels/
foi criado recentemente e devemos verificar o código inicial.
Já tivemos acesso às fontes cubistas por um tempo (mas houve um acordo explícito de não vinculá-lo a outros sw) e debatemos as diferentes opções para incorporar o código, mas eu refino
fonte
A documentação do C5.0 (Linux) está em http://rulequest.com/see5-unix.html
fonte