Tenho formação em programação de computadores e teoria elementar dos números, mas não tenho treinamento em estatística real, e recentemente "descobri" que o incrível mundo de toda uma gama de técnicas é realmente um mundo estatístico. Parece que fatorações matriciais, conclusão matricial, tensores de alta dimensão, incorporação, estimativa de densidade, inferência bayesiana, partições de Markov, computação de vetor próprio, PageRank são todas técnicas altamente estatísticas e que os algoritmos de aprendizado de máquina que usam essas coisas usam muitas estatísticas .
Meu objetivo é ser capaz de ler artigos que discutem essas coisas e implementar ou criar os algoritmos, enquanto entendemos a notação, "provas" e argumentos estatísticos usados. Acho que o mais difícil é seguir todas as provas que envolvem matrizes.
Que documentos básicos podem me ajudar a começar? Ou um bom livro com exercícios que valem a pena ser trabalhados?
Especificamente, alguns artigos que eu gostaria de entender completamente são:
- Conclusão exata da matriz via otimização convexa, Candes, Recht, 2008
- Transformação Rápida de Cauchy e Regressão Linear Mais Rápida e Robusta, Clarkson et al, 2013
- Projeções aleatórias para máquinas de vetores de suporte, Paul et al, 2013
- Estimativa de Probabilidade em Alta Dimensão com Modelos de Densidade Profunda, Rippel, Adams, 2013
- Obtenção de estimativas minimizadoras de erros e limites universais de erros inteligentes para conclusão de matrizes de baixa classificação, Király, Theran, 2013
fonte
Respostas:
Eu recomendaria o curso Andrew Ngs Machine Learning no Coursera, que oferece uma cobertura brilhante de todos os princípios. Se você está estudando alguma coisa a ver com modelos gráficos probabilísticos, o curso Daphne Kollers também seria bom.
Este é um tesouro para recursos de auto-estudo também http://ragle.sanukcode.net/articles/machine-learning-self-study-resources/ As palestras de Herb Grossman são impressionantes.
Também me recomendaram este livro https://www.openintro.org/stat/textbook.php, pois estou sempre aprendendo a mim mesmo e as estatísticas não são o meu histórico!
Meus dois centavos são o lado da matemática das coisas e dos papéis, no entanto, é que não se envolva muito com a matemática de fundo. Aprenda o básico e faça referência aos documentos em que os documentos mencionados são construídos e veja se são mais fáceis (talvez você precise voltar alguns documentos para obter algo que possa entender - é o que eu mesmo faço) - existem muitos diferentes elementos matemáticos em ML e é fácil ser sugado por uma toca de coelho (novamente algo que eu já fiz mais de uma vez!).
Boa sorte, é um campo realmente interessante!
fonte