Sou engenheiro de Ciência da Computação, sem formação em estatística ou matemática avançada.
Estou estudando o livro Python Machine Learning de Raschka e Mirjalili, mas quando tentei entender a matemática do Machine Learning, não consegui entender o grande livro que um amigo me sugere Os elementos do aprendizado estatístico .
Você conhece algum livro de estatística e matemática mais fácil para o Machine Learning? Se não, como devo mudar?
machine-learning
statistics
reference-request
math
Tantaros
fonte
fonte
Respostas:
Embora você precise reservar, recomendo os seguintes cursos, respectivamente, para entender as estatísticas usadas para o aprendizado de máquina e outras tarefas na ciência de dados. Eles são livres.
Se eu quiser recomendar um livro, recomendo o livro a seguir, gratuito sob licença CC . Tem bons exemplos e é muito prático; além disso, existem muitos códigos nele que ajudam a sentir as estatísticas em exemplos do mundo real.
Think Python por Allen B. Downey
Manual de ciência de dados do Python
Além disso, o seguinte link pode ajudar:
fonte
Introdução à Álgebra Linear https://math.mit.edu/~gs/linearalgebra/ é um bom ponto de partida. Verifique se você é bom em Teoria das Probabilidades, Álgebra Linear e Estatística. Um conhecimento muito profundo pode não ser necessário, mas é necessário ter um bom conhecimento.
fonte
Antes de fazer meu mestrado em Analytics, fui sugerido por meus alunos a ler esses dois livros para saber mais sobre Machine Learning e Estatística.
Nomeadamente:
Se você não encontrar esses livros on-line, informe-me sobre o compartilhamento do link, eu os tenho no meu disco. Esses livros me ajudaram a entender o básico das estatísticas com exemplos explicados em termos leigos.
Se você estiver procurando por alguns cursos on-line, informe-me para sugerir alguns bons cursos (a maioria deles é grátis).
fonte
Não posso dizer da sua pergunta como você é adepto de matemática ou onde seu aprendizado para. Presumo que, como você é um engenheiro de software de computador, esteja familiarizado com álgebra, geometria e, talvez, algum cálculo.
Eu recomendo que você inicie seu aprendizado lendo estatísticas e compreendendo conceitos como descritivos, análise exploratória de dados, correlação, distribuições e assim por diante. Vejo que você prefere livros ao invés de vídeos, por isso vou encontrá-lo no meio do caminho e fornecer alguns livros on-line, além de um ou dois livros que você pode comprar impresso.
Primeiro, eu recomendaria o currículo do curso de pós-graduação da Penn State em estatística . Você pode explorar cada um dos cursos usando o menu à esquerda. Depois de selecionar um curso, role para baixo na página do curso e clique no link que diz "notas do curso on-line". As notas do curso para esses cursos são muito mais do que notas e são lidas como livros completos. Eles são muito instrutivos. Além disso, verifique também o currículo on-line do curso de graduação da Penn State em estatística , caso você encontre algo nos cursos de pós-graduação muito avançado e queira uma explicação "mais simples".
Segundo, revise o Handbook of Biological Statistics de John H. McDonald. Não deixe o título enganar você; este livro é uma excelente cartilha sobre estatística e análise de dados aplicável a qualquer domínio.
Terceiro, revise O Pequeno Manual de Estatística, de Gerard Dallal. Novamente, não deixe o título enganar você; este livro é outra jóia que mostra alguns fundamentos importantes de estatística.
Quarto, confira o livro Think Stats, de Allen Downey. Há uma versão gratuita online de uma edição anterior; a edição mais recente que você terá que comprar. Vale a pena, especialmente se você trabalha em Python. Neste livro, o autor ensina estatística e análise de dados usando o Python para analisar conjuntos de dados do mundo real (de brinquedo). Este é realmente um ótimo livro para se trabalhar.
Por fim, confira Data Science from Scratch, de Joel Grus. Este livro se concentra mais na análise de dados (em vez dos fundamentos estatísticos) e enfatiza mais o aprendizado de máquina e a modelagem. Ele usa o Python (e a pilha de ciência de dados do Python) para orientá-lo na análise e condução de análises preditivas em conjuntos de dados do mundo real (de brinquedo). Outro ótimo livro para trabalhar.
fonte
Tenha em mente que, enquanto eu tiver um mestrado em estatística aplicada, vou lhe dar uma resposta muito simples: faça um curso sobre probabilidades.
A maioria das estruturas de programação modernas de ML retira grande parte da matemática da ciência de dados; você realmente não precisará disso na maioria dos cenários. Mas você sempre precisará entender seus resultados e a maioria dos resultados é expressa em probabilidades. Se eu fosse novato em ciência de dados, faria um (breve) curso sobre probabilidades, tentaria entender o que proporções e porcentagens realmente significam e trabalharia para conhecer realmente muito bem uma estrutura (como o Tensorflow). Se você pode fazer isso, pode escrever alguns algoritmos realmente interessantes e não precisa ser obsessivo com a matemática.
fonte