Como engenheiro de software, estou interessado em tópicos como algoritmos estatísticos, mineração de dados, aprendizado de máquina, redes bayesianas, algoritmos de classificação, redes neurais, cadeias de Markov, métodos de Monte Carlo e geração de números aleatórios.
Pessoalmente, não tive o prazer de trabalhar com nenhuma dessas técnicas, mas tive que trabalhar com software que, sob o capô, as empregava e gostaria de saber mais sobre elas em alto nível. Estou à procura de livros que cubram uma grande amplitude - não é necessária grande profundidade neste momento. Penso que posso aprender muito sobre desenvolvimento de software se entender os fundamentos matemáticos por trás dos algoritmos e técnicas empregados.
A comunidade da Análise estatística pode recomendar livros que eu possa usar para aprender mais sobre a implementação de vários elementos estatísticos no software?
fonte
Aqui está um livro muito bom de James E. Gentle, Estatísticas Computacionais (Springer, 2009), que abrange aspectos computacionais e estatísticos da análise de dados. Gentle também é autor de outros grandes livros, confira suas publicações.
Outro grande livro é o Handbook of Computational Statistics , de Gentle et al. (Springer, 2004); está circulando como PDF em algum lugar da Web, então tente vê-lo no Google.
fonte
Você mencionou algumas técnicas de ML, então dois livros bastante agradáveis (porque, infelizmente, o meu favorito é em polonês):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html
Para coisas numéricas como a geração de números aleatórios:
http://www.nr.com/
fonte
Peguei uma cópia do Probability and Statistics for Computer Scientists - Michael Baron à venda com outro livro de estatísticas (eu honestamente o comprei por causa do nome - eu queria um livro que analisasse estatísticas da perspectiva da ciência da computação, mesmo que não fosse perfeito). Ainda não tive a chance de ler ou resolver nenhum problema, mas parece um livro sólido.
O prefácio do livro diz que é para estudantes de nível superior e iniciantes, e eu concordo com isso. É necessário algum entendimento de probabilidade e estatística para compreender o conteúdo deste livro.
Os tópicos incluem probabilidade, variáveis aleatórias discretas, distribuições contínuas, métodos de Monte Carlo, processos estocásticos, sistemas de filas, inferência estatística e regressão.
fonte
Embora não seja especificamente estatística computacional, Um Manual de Análises Estatísticas Usando R - Brian S. Everitt e Torsten Hothorn aborda muitos tópicos que eu já vi abordados em livros estatísticos básicos e intermediários - inferência, ANOVA, regressão linear, regressão logística, estimativa de densidade, particionamento recursivo, análise de componentes principais e análise de cluster - usando a linguagem R. Isso pode ser de interesse para os interessados em programação.
Entretanto, diferentemente de outros livros, a ênfase está no uso da linguagem R para executar essas funções estatísticas. Outros livros que eu vi usam combinações de álgebra e cálculo para demonstrar estatísticas. Este livro realmente se concentra em como analisar dados usando a linguagem R. E para torná-lo ainda mais útil, os conjuntos de dados que os autores usam estão no CRAN - o Repositório R.
fonte
A computação estatística com R - Maria L. Rizzo cobre muitos dos tópicos em Probabilidade e estatística para cientistas da computação - probabilidade e estatística básicas, variáveis aleatórias, estatística bayesiana, cadeias de Markov, visualização de dados multivariados, métodos de Monte Carlo, testes de permutação, probabilidade estimativa de densidade e métodos numéricos.
As equações e fórmulas utilizadas são apresentadas tanto em fórmulas matemáticas quanto em código R. Eu diria que um conhecimento básico de probabilidade, estatística, cálculo e talvez matemática discreta seria aconselhável para quem quiser ler este livro. Um background de programação também seria útil, mas existem algumas referências para a linguagem R, operadores e sintaxe.
fonte
Como engenheiro de computação que vem analisando dados, um livro realmente legível que cobre as coisas de uma perspectiva bastante pouco intimidadora e legível (ao custo de não cobrir tanto quanto qualquer outro livro sugerido aqui) foi Programming Collective Intelligence, de Toby Segaran. Achei muito mais acessível do que, por exemplo, o livro de Bishop, que é uma ótima referência, mas é mais aprofundado do que você provavelmente deseja em um primeiro passo. Na amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325
fonte
O CRAN tem vários bons exemplos de livros referentes à programação estatística. Alguns deles não pertencem ao aprendizado de máquina e ao MCMC, mas cada entrada é anotada; portanto, você deve ter uma idéia aproximada do que cada livro contém para aprofundar um pouco mais. http://www.r-project.org/doc/bib/R-books.html
fonte