Livro de receitas de aprendizado de máquina / cartão de referência / folha de dicas?

57

Acho recursos como o Livro de Receitas de Probabilidades e Estatísticas e o Cartão de Referência R para Mineração de Dados incrivelmente úteis. Obviamente, eles servem bem como referências, mas também me ajudam a organizar meus pensamentos sobre um assunto e obter a configuração da terra.

P: Existe algum desses recursos para métodos de aprendizado de máquina?

Estou imaginando um cartão de referência que, para cada método ML, incluiria:

  • Propriedades gerais
  • Quando o método funciona bem
  • Quando o método faz mal
  • De quais ou para quais outros métodos o método se generaliza. Foi substituído principalmente?
  • Artigos seminais sobre o método
  • Problemas em aberto associados ao método
  • Intensidade computacional

Todas essas coisas podem ser encontradas com alguma pesquisa mínima nos livros, tenho certeza. Seria realmente conveniente tê-los em algumas páginas.

lowndrul
fonte
5
Um bom objetivo, mas "escavar minimamente alguns livros didáticos"? Como alguém poderia começar a comprimir, digamos, esses 20 livros para aprendizado estatístico e mineração de dados + mloss.org/software/rating ?
Denis27
2
(+1) para a chuzpa, se essa visão geral existir, eu pagaria por ela. O principal problema é que, além de algumas propriedades que poderiam ser derivadas do próprio algoritmo, a maioria dessas propriedades ou regras básicas é obtida pela experiência, ou seja, pela aplicação. Tenho certeza de que um pesquisador aplicado ou um programador / consultor de framework de ML, capaz de escrever algo assim ... mas aqui e agora?
Steffen
@ Denis: o link "20 livros .." não funciona, você pode verificar isso?
Lmsasu 26/07/12
6
Como eu não sou especialista em aprendizado de máquina, vou adiar para outras pessoas postarem respostas, mas acho que The Elements of Statistical Learning é considerado um bom texto sobre o assunto e foi escrito por alguns dos maiores nomes do campo. Devo acrescentar que este livro foi escrito em alto nível e aqueles que ouvi recomendam que ele tenha PhDs em estatística.
Macro

Respostas:

25

Alguns dos melhores recursos disponíveis gratuitamente são:

Quanto à pergunta do autor, não encontrei a solução "Tudo em uma página"

Sergey
fonte
Sergey, o livro de Barber está ligado ao Matlab?
Denis
2
Sim, basta dar uma olhada no link do livro: A caixa BRMLtool é fornecida para ajudar os leitores a ver como os modelos matemáticos se traduzem no código MAT-LAB real.
Sergey
31

Se você deseja aprender Machine Learning, recomendo fortemente que você se inscreva no curso de ML online gratuito no inverno, ministrado pelo Prof. Andrew Ng .

Eu fiz o anterior no outono e todo o material de aprendizado é de qualidade excepcional e é voltado para aplicações práticas, e é muito mais fácil entender que lutar sozinho com um livro.

Também produziu uma fruta bem baixa, com boas explicações intuitivas e a quantidade mínima de matemática.

clyfe
fonte
Acabei de terminar este curso e é incrível! Além disso, isso me deu um ótimo começo para entender os livros sobre aprendizado de máquina.
B Seven
11
Acho que este link agora é coursera.org/course/ml
n611x007
14

Sim, você está bem; "Reconhecimento de padrões e aprendizado de máquina" de Christopher Bishop é um excelente livro para referência geral, você não pode realmente dar errado com ele.

Um livro bastante recente, mas também muito bem escrito e igualmente amplo, é o " Bayesian Reasoning and Machine Learning " de David Barber ; um livro que eu consideraria um pouco mais adequado para um novato em campo.

Eu usei "Os elementos do aprendizado estatístico" de Hastie et al. (mencionado por Macro) e, embora seja um livro muito forte, eu não o recomendaria como primeira referência; talvez o sirva melhor como segunda referência para tópicos mais especializados. Nesse aspecto, o livro de David MacKay, Teoria da informação, Inferência e Algoritmos de aprendizado , também pode fazer um trabalho esplêndido.

usεr11852 diz Reinstate Monic
fonte
2
+1 para o bispo. Desenvolvimento claro com um nível uniforme de detalhe. Embora ainda bom, sempre achei Hastie et al. um pouco agitado.
conjugateprior
11
+1 - Hastie, Tibshirani e Friedman é o meu favorito.
Stask
11
+1 também por recomendar Hastie, Tibshirani e Friedman, meu favorito também. E obrigado pelas outras recomendações; Vou ler para eles, porque realmente preciso de um bom livro para recomendar a não estatísticos (ou pessoas que acabam de entrar no campo).
Néstor
11
+1 para o bispo. Na verdade, é uma ótima fonte para estatísticas clássicas também, mas atualizada e disfarçada.
conjecturas
10

Como o consenso parece ser que essa pergunta não é uma duplicata, eu gostaria de compartilhar o meu favorito dos iniciantes em aprendizado de máquina:

Achei a Programming Collective Intelligence o livro mais fácil para iniciantes, já que o autor Toby Segaran está focado em permitir que o desenvolvedor de software mediano suje as mãos com hackers de dados o mais rápido possível.

Capítulo típico: O problema dos dados é claramente descrito, seguido de uma explicação aproximada de como o algoritmo funciona e, finalmente, mostra como criar algumas idéias com apenas algumas linhas de código.

O uso de python permite que você entenda tudo bastante rápido (você não precisa conhecer python, sério, eu também não sabia disso antes). NÃO pense que este livro está focado apenas na criação de um sistema de recomendação. Ele também lida com mineração de texto / filtragem de spam / otimização / clustering / validação etc. e, portanto, fornece uma visão geral clara das ferramentas básicas de cada minerador de dados.

Steffen
fonte
6

Witten e Frank, "Data Mining", Elsevier 2005 é um bom livro para auto-aprendizado, pois há uma biblioteca de código Java (Weka) para acompanhar o livro e é bastante orientada para a prática. Suspeito que exista uma edição mais recente que a minha.

Dikran Marsupial
fonte
11
Sim, este livro deveria ser chamado de "Machine Learning", mas o nome foi alterado para "Data Mining" pelos editores para seguir o hype de mineração de dados da época. No entanto, o livro é sobre ML e não DM (as duas semelhanças simples, mas são campos diferentes!).
clyfe
11
O livro de Tom Mitchell "Machine Learning" também é muito bom; o estilo é um pouco antiquado, mas o conteúdo é excelente.
Dikran Marsupial
Sim, o ML de Tom Mitchell é como a Bíblia do ML, realmente abrangente em campo!
clyfe
5

"Elementos de aprendizagem estatística" seria um ótimo livro para seus propósitos. A 5ª edição do livro, publicada no início de 2011, está disponível gratuitamente em http://www.stanford.edu/~hastie/local.ftp/Springer/ESLII_print5.pdf

DanB
fonte
2
é um livro pesado de matemática, portanto, pode ser difícil para o aprendiz seguir.
Atilla Ozgur
Você sabe como é possível fazer o download gratuito nas páginas pessoais de Trevor Hastie quando a Springer cobra 70 $ por isso?
Alfred M.
Não sei ao certo, mas imagino que Springer quer o dinheiro, e os autores querem principalmente divulgar amplamente seu livro. Isso parece muito semelhante ao modo como a Springer venderá seus artigos publicados, enquanto muitas "versões de documentos de trabalho" estão disponíveis gratuitamente no site do autor.
DanB
Para sua informação, o download é para a 5ª impressão da segunda edição. Adoro a nota de rodapé do eipgraph "Em Deus confiamos, todos os outros trazem dados" que são atribuídos a Deming. A nota de rodapé indica a ironia de que nenhum "dado" pode ser encontrado confirmando Deming realmente dizendo isso.
usar o seguinte código
Você deve mencionar Introdução ao aprendizado estatístico com R - é como o ESL -lite (se a matemática em ESL for muito assustadora).
Steve S
5

insira a descrição da imagem aqui

Muitas vezes, a parte mais difícil de resolver um problema de aprendizado de máquina pode ser encontrar o estimador certo para o trabalho. Estimadores diferentes são mais adequados para diferentes tipos de dados e diferentes problemas. O fluxograma abaixo foi desenvolvido para fornecer aos usuários um guia geral sobre como abordar problemas em relação a quais estimadores tentar seus dados. Clique em qualquer estimador na tabela abaixo para ver a documentação.

Anton Tarasenko
fonte
3

A maioria dos livros mencionados em outras respostas é muito boa e você não pode realmente dar errado com nenhum deles. Além disso, acho útil a seguinte folha de dicas para o Python scikit-learn.

Marc Claesen
fonte
2

Eu gosto da "Classificação dos Padrões" de Duda, Hart e Stork. Esta é uma revisão recente de um texto clássico que explica tudo muito bem. Não tenho certeza se está atualizado para ter muita cobertura de redes neurais e SVMs. O livro de Hastie, Tibshirani e Friedman é o melhor que existe, mas pode ser um pouco mais técnico do que o que você está procurando e é mais detalhado do que uma visão geral do assunto.

Michael Chernick
fonte
2

O Microsoft Azure também fornece uma folha de dicas semelhante à do scikit-learn postada por Anton Tarasenko.

Folha de dicas do algoritmo de aprendizado de máquina do Microsoft Azure

(fonte: https://docs.microsoft.com/en-us/azure/machine-learning/machine-learning-algorithm-cheat-sheet )

Eles o acompanham com um aviso:

As sugestões oferecidas nesta folha de dicas sobre algoritmos são regras práticas aproximadas. Alguns podem ser dobrados e outros podem ser flagrantemente violados. Isso pretende sugerir um ponto de partida. (...)

A Microsoft também fornece um artigo introdutório que fornece mais detalhes.

Observe que esses materiais estão focados nos métodos implementados no Microsoft Azure.

Tim
fonte
1

Não comece com Elements of Statistical Learning. É ótimo, mas é um livro de referência, que não soa como o que você está procurando. Eu começaria com a programação de inteligência coletiva, pois é uma leitura fácil.

Neil McGuigan
fonte
Não tenho certeza se caracterizaria ESL como um texto de referência. Parece-me mais uma visão geral, ou seja, você não vai aprender os detalhes minuciosos de (quase) nada. Você verá as técnicas amplas e os temas abrangentes.
cardeal
1

Para um primeiro livro sobre aprendizado de máquina, que explica bem os princípios, recomendo vivamente

Rogers e Girolami, um primeiro curso de aprendizado de máquina (Chapman & Hall / CRC Machine Learning & Pattern Recognition), 2011.

O livro de Chris Bishop, ou o de David Barber, faz boas escolhas para um livro com maior amplitude, depois de entender bem os princípios.

Dikran Marsupial
fonte
0

Escrevi um resumo como esse, mas apenas em uma tarefa de aprendizado de máquina (Prêmio Netflix), e ela possui 195 páginas: http://arek-paterek.com/book

Arek Paterek
fonte
0

Uma boa folha de dicas é aquela do livro Max Kuhn, Applied Predictive Modeling . No livro, há uma boa tabela de resumo de vários modelos de aprendizado de ML. A tabela está no apêndice A, página 549.

PolBM
fonte