Embora tenha sido treinado como engenheiro, acho que estou me interessando mais pela mineração de dados. No momento, estou tentando investigar mais o campo. Em particular, eu gostaria de entender as diferentes categorias de ferramentas de software que existem e quais ferramentas são notáveis em cada categoria e por quê. (Observe que eu não disse as "melhores" ferramentas, apenas as mais notáveis, para não começarmos uma guerra de chamas.) Especialmente, tome nota das ferramentas que são de código aberto e disponíveis gratuitamente - embora não entendam que isso significa que Estou interessado apenas em código aberto e gratuito.
data-mining
John Berryman
fonte
fonte
Respostas:
Esta é provavelmente a lista mais abrangente que você encontrará: mloss.org
fonte
Dê uma olhada em
e o Repositório de aprendizado de máquina da UCI para conjuntos de dados.
fonte
Rattle é uma GUI de mineração de dados que fornece um front end para uma ampla variedade de pacotes R.
fonte
Dê uma olhada no KNIME .
Muito fácil de aprender. Com muitas possibilidades de progresso. Integra-se perfeitamente com Weka e R.
fonte
Da perspectiva da popularidade, este artigo (2008) examina os 10 principais algoritmos na mineração de dados .
fonte
RapidMiner (Java) [código aberto]
fonte
Existe o ELKI , um projeto universitário de código aberto um tanto comparável ao WEKA, mas muito mais forte quando se trata de agrupamento e detecção externa. WEKA, na verdade, não é realmente mineração de dados, mas software de aprendizado de máquina.
fonte
Existe esse Red-R que possui uma interface gráfica agradável e interface de programação visual. Utiliza R para processar as várias análises de dados.
fonte
A Rexer Anlaytics faz uma pesquisa de kit de ferramentas todos os anos. O KDnuggets tem descrições de software por setor, bem como por intenção.
fonte
O SQL Server Data Mining (SSDM) não é atualizado há muito tempo, mas ainda é bastante competitivo se você estiver explorando grandes bancos de dados e cubos relacionais. Estou lenta, mas sistematicamente, percorrendo os testes de tantas ferramentas de mineração quanto possível e a interface do Windows do SQL Server é a mais produtiva e estável que eu encontrei até agora (principalmente quando se trata de bancos de dados corporativos, alguns dos quais surpreendentemente interfaces desleixadas) apesar da idade. Eu preferiria uma interface moderna do Windows Presentation Foundation (WPF), mas essa é a próxima melhor coisa.
Eu escrevi uma série de tutoriais amadores detalhados sobre ele, intitulado A Rickety Stairway to SQL Server Data Mining , quando eu estava tentando adquirir algumas habilidades básicas de mineração. Apesar da minha inexperiência, eles ainda são úteis para ajudar a identificar algumas das "pegadinhas" com antecedência.
fonte