Livro para leitura antes de Elements of Statistical Learning?

50

Com base neste post , quero digerir Elements of Statistical Learning. Felizmente, está disponível gratuitamente e comecei a lê-lo.

Eu não tenho conhecimento suficiente para entender isso. Você pode recomendar um livro que seja uma introdução melhor aos tópicos do livro? Espero que algo que me dê o conhecimento necessário para entendê-lo?

Palavras-chave:

Uma sólida formação em matemática é um requisito total para o ML?

desconhecidos
fonte
12
Eu achei a Álgebra Linear de Strang e suas aplicações extremamente úteis para entender as manipulações matriciais que formam uma grande parte dos elementos.
richiemorrisroe

Respostas:

18

Comprei, mas ainda não li,

S. Marsland, Aprendizado de Máquina: Uma Perspectiva Algorítmica , Chapman & Hall, 2009.

No entanto, as críticas são favoráveis ​​e afirmam que é mais adequado para iniciantes do que outros livros de ML que têm mais profundidade. Folheando as páginas, parece-me bom porque tenho pouco conhecimento em matemática.

Steve P
fonte
Parece ótimo - muito acessível.
B Sete
Eu baixei e li a "amostra" - todas as 19 páginas (uau). É muito mais fácil entender do que Os elementos do aprendizado estatístico. Definitivamente parece ser o que estou procurando. Obrigado.
B Sete
4
Fizemos edições na sua pergunta para fornecer uma citação para o livro. De um modo geral, colocar coisas como "eu gosto deste " em uma resposta é desencorajado, pois se o link quebrar, ninguém saberá a que "este" estava se referindo. Felicidades.
cardeal
Acabei de entender e comecei a ler (primeiras 75 páginas). Isso é incrível. Muito fácil de entender, mas detalhado o suficiente para ser prático e útil. Altamente recomendado para quem deseja usar o Machine Learning. Exatamente o que eu estava procurando. Obrigado!
B Seven
39

Os autores de Elements of Statistical Learning lançaram um novo livro (agosto de 2013) destinado a usuários sem formação matemática intensa. Uma Introdução à Aprendizagem Estatística: com Aplicações em R

A versão gratuita em PDF deste livro pode ser encontrada aqui .

Brian
fonte
Eu sugeriria isso desde o lançamento recente e obviamente está fortemente relacionado ao texto objetivo do pôster. Boa recomendação.
Chris Simokat
3
Melhor ainda, os autores anunciaram que um pdf online gratuito deste livro estará disponível a partir de janeiro de 2013 (ele está sendo usado em um MOOC que estão em execução.)
Flounderer
16

Achei a Programming Collective Intelligence o livro mais fácil para iniciantes, já que o autor Toby Segaran está focado em permitir que o desenvolvedor de software mediano suje as mãos com hackers de dados o mais rápido possível.

Capítulo típico: O problema dos dados é claramente descrito, seguido de uma explicação aproximada de como o algoritmo funciona e, finalmente, mostra como criar algumas idéias com apenas algumas linhas de código.

O uso de python permite que você entenda tudo bastante rápido (você não precisa conhecer python, sério, eu também não sabia disso antes). NÃO pense que este livro está focado apenas na criação de um sistema de recomendação. Ele também lida com mineração de texto / filtragem de spam / otimização / clustering / validação etc. e, portanto, fornece uma visão geral clara das ferramentas básicas de cada minerador de dados.

O capítulo 10 até lida com dados do mercado de ações, mas o foco não está na mineração de dados de séries temporais. Talvez a única desvantagem (para você) deste excelente livro.

Steffen
fonte
Está disponível no safaribooksonline.com do Safari Books Online . Obrigado.
B Sete
11
Comprei este livro e comecei a trabalhar com ele. É muito prático. Nas 18 primeiras páginas, você implementa um mecanismo de recomendação (básico) completo.
B Sete
Uau, este livro é realmente incrível. Ele ensina como implementar todos os tipos de algoritmos de Machine Learning com apenas um pouco de código Python. Um dos livros mais práticos de todos os tempos. A única desvantagem é que o Python foi atualizado desde que o livro foi publicado. Ele também usa muitas APIs que também foram alteradas. Portanto, acho que os exemplos não funcionarão sem alguns ajustes.
B Seven
@ Seven, obrigado, não sabia disso. Não tenho certeza se prefiro um livro que utilize bibliotecas preexistentes (o que geralmente é possível) ou seu próprio código (que funciona para todos os exemplos de livros, mas pode ser menos robusto devido a menos usuários).
Steffen
11
Atualmente, acho que a única opção são bibliotecas pré-existentes. Eles são onipresentes, fáceis de integrar, multiplataforma, multilíngue e rápidos. Além disso, se um livro tiver seu próprio código, é muito mais difícil modificar. É mais fácil modificar chamadas para uma biblioteca. Obrigado pela recomendação. Isto é um ótimo recurso.
B Sete
13

Introdução ao Machine Learning , de E. Alpaydin (MIT Press, 2010, 2ª ed.), Aborda muitos tópicos com boas ilustrações (como o reconhecimento de padrões de Bishop e o aprendizado de máquina ).

Além disso, Andrew W. Moore tem alguns bons tutoriais sobre estatística de mineração de dados .

chl
fonte
(1) Não sei o livro, mas os tutoriais de Andrew Moore são grandes (e até divertido às vezes)
Steffen
@steffen Também recomendo os Métodos Estatísticos de Radford Neale para Machine Learning e Mineração de Dados .
Chl
11
+1 Alpaydin é o caminho certo a seguir. Eu estava exatamente na mesma situação do OP alguns meses atrás. Lutando muito com Tibshirani, e depois me deparei com Alpaydin e as coisas ficaram muito melhores desde então. Eventualmente, embora eu ache que Tibshirani é uma leitura obrigatória.
Andy
10

Talvez o All of Statistics de Wasserman seria interessante. Você pode experimentar o livro a partir do link fornecido - e apenas os primeiros parágrafos do prefácio fazem uma venda difícil para o seu mercado - e provavelmente poderá fazer o download do livro gratuitamente através da Springer, se estiver associado a uma universidade.

EDIT: Opa, não percebi o quão antigo esse tópico era.

cara
fonte
5
Não importa, a recomendação ainda é útil para todos que lêem o tópico (como eu; o).
Dikran Marsupial 23/10/12
11
Ótimo livro, mas com justiça, se é possível ler e compreender o All of Statistics , boa parte do ESL é redundante.
usεr11852 diz Reinstate Monic
7

Os elementos do aprendizado estatístico podem ser uma leitura difícil, especialmente para um aprendiz. Enquanto procurava algumas explicações no segundo capítulo, me deparei com o seguinte recurso: https://waxworksmath.com/Authors/G_M/Hastie/WriteUp/Weatherwax_Epstein_Hastie_Solution_Manual.pdf . Ele contém mais de 100 páginas de anotações e explicações que esclarecem alguns momentos complicados do livro. Um ótimo recurso para todos que estão lendo este livro. Este texto complementar inclui soluções para exercícios.

Kirill Dubovikov
fonte
5

Eu recomendaria fortemente um primeiro curso de aprendizado de máquina de Rogers e Girolami. Ele cobre as idéias-chave em uma ordem muito lógica, com bons exemplos e com o nível mínimo de matemática para ter uma base adequada nos fundamentos. Não tem a abrangência de alguns livros, mas é exatamente por isso que é tão bom quanto um texto introdutório.

Dikran Marsupial
fonte
Parece um bom primeiro livro. E há uma versão do Kindle.
B Sete
3

Outro livro muito interessante é o Raciocínio Bayesiano e o Aprendizado de Máquina, de David Barber. O livro está disponível para download gratuito no site do autor: http://www.cs.ucl.ac.uk/staff/d.barber/brml/

user111093
fonte