Construindo interfaces MATLAB e R para C5.0 de Ross Quinlan

10

Estou pensando em construir interfaces MATLAB e R para Ross Quinlan 's C5.0 (para aqueles que não estão familiarizados com ele, C5.0 é um pacote de algoritmo de árvore de decisão e software; uma extensão de C4.5 ), e eu estou tentando ter uma idéia dos componentes que eu precisaria escrever.

A única documentação que encontrei para o C5.0 está aqui , que é um tutorial para o See5 (uma interface do Windows para o C5.0?). O arquivo tar vem com um Makefile, mas nenhum arquivo Leiame ou qualquer documentação adicional.

Pelo que li no tutorial acima, o C5.0 usa uma representação baseada em ASCII para manipular entradas e saídas, e também estou pensando em construir uma interface que transmita dados binários diretamente entre o MATLAB ou R e C5.0. A representação de dados do C5.0 é usada por qualquer outro software de aprendizado de máquina / classificação?

Alguém já tentou criar uma interface MATLAB ou R para ID3, C4.5 ou C5.0 antes?

obrigado

Amelio Vazquez-Reina
fonte
Este projeto está em andamento? Eu tentei instalar o pacote C5.0 no R, mas falhei.
Você já fez uma implementação do C5 para o Matlab? Se você fez, seria extremamente útil. Estou analisando a interface do C5 com o Matlab agora, mas o C5 parece um pouco confuso (não pode simplesmente passar arquivos de texto para ele, uma vez que usa uma formatação difícil).
precisa

Respostas:

11

Parece uma ótima idéia, especialmente porque a página para a qual você vincula mostra que o C5.0 agora está sob GPL.

Tenho alguma experiência em agrupar o software C / C ++ para R usando Rcpp ; Eu ficaria feliz em ajudar.

Dirk Eddelbuettel
fonte
11
muito obrigado por oferecer ajuda. Temos alguns alunos em nosso laboratório que podem investigar isso. Avisaremos assim que descobrirmos as coisas :) #
Amelio Vazquez-Reina
5

A interface do código C / C ++ para o MATLAB é bastante direta, tudo o que você precisa fazer é criar uma função de gateway MEX para lidar com a conversão de parâmetros e os parâmetros de retorno. Tenho experiência em criar arquivos MEX para fazer esse tipo de coisa e ficaria feliz em ajudar.

Dikran Marsupial
fonte
isso parece ótimo! Obrigado por estar disposto a ajudar. Temos alguns alunos em nosso laboratório e eles podem entrar em contato com você se precisarmos de ajuda.
Amelio Vazquez-Reina
4

ATUALIZAR:

Agora no CRAN:

http://cran.r-project.org/web/packages/C50/index.html

ORIGINAL:

Estamos trabalhando nisso há algum tempo (começando com o Cubist e depois trabalhando no C5.0).

Se você deseja contribuir:

https://r-forge.r-project.org/projects/rulebasedmodels/

foi criado recentemente e devemos verificar o código inicial.

Já tivemos acesso às fontes cubistas por um tempo (mas houve um acordo explícito de não vinculá-lo a outros sw) e debatemos as diferentes opções para incorporar o código, mas eu refino

topepo
fonte