Sou um novato que começará a ler sobre mineração de dados. Eu tenho conhecimentos básicos de IA e estatística. Como muitos dizem que o aprendizado de máquina também desempenha um papel importante na mineração de dados, é necessário ler sobre o aprendizado de máquina antes que eu possa continuar com a mineração de dados?
machine-learning
references
data-mining
Formigas
fonte
fonte
Respostas:
Estando um pouco nessa posição, tentarei dar algumas dicas.
Em primeiro lugar, faça o download dos Elements of Statistical Learning . Pressupõe cálculo e álgebra linear e, embora seja muito técnico, também é extremamente bem escrito.
Em segundo lugar (ou em primeiro lugar), veja os tutoriais de Andrew Ng sobre aprendizado de máquina.
Em terceiro lugar, obtenha alguns dados e comece a tentar analisar os dados. Você precisará se dividir em conjuntos de treinamento e teste e criar modelos no conjunto de treinamento e testá-los no conjunto de testes. Achei o pacote de sinal de intercalação para R muito útil para tudo isso. Depois disso, pratique, pratique (como quase todo o resto).
fonte
Introdução à mineração de dados por Tan, Steinbech, Kumar é o melhor livro de introdução disponível
http://www.amazon.com/Introduction-Data-Mining-Pang-Ning-Tan/dp/0321321367
salve o EoSL para quando desejar aprofundar. É mais uma referência.
fonte
A mineração de dados pode ser descritiva ou preditiva.
Por um lado, se você estiver interessado em mineração descritiva de dados, o aprendizado de máquina não ajudará.
Por outro lado, se você estiver interessado em mineração preditiva de dados, o aprendizado de máquina o ajudará a entender que você tenta minimizar o risco desconhecido (expectativa da função de perda) ao minimizar o risco empírico: você terá em mente o excesso de ajustes, generalização erro e validação cruzada. Por exemplo, por uma questão de consistência, ok -NN para uma amostra de treinamento de tamanhon deve ser tal que:
fonte
Eu apenas adiciono outra fonte muito boa de tutoriais sobre mineração de dados / aprendizado de máquina por Tom Mitchell .
Ele explica com muita clareza e você também pode fazer o download de suas apresentações em seu site (além de assistir às palestras).
fonte