Quais livros fornecem uma visão geral das estatísticas computacionais que se aplicam à ciência da computação?

15

Como engenheiro de software, estou interessado em tópicos como algoritmos estatísticos, mineração de dados, aprendizado de máquina, redes bayesianas, algoritmos de classificação, redes neurais, cadeias de Markov, métodos de Monte Carlo e geração de números aleatórios.

Pessoalmente, não tive o prazer de trabalhar com nenhuma dessas técnicas, mas tive que trabalhar com software que, sob o capô, as empregava e gostaria de saber mais sobre elas em alto nível. Estou à procura de livros que cubram uma grande amplitude - não é necessária grande profundidade neste momento. Penso que posso aprender muito sobre desenvolvimento de software se entender os fundamentos matemáticos por trás dos algoritmos e técnicas empregados.

A comunidade da Análise estatística pode recomendar livros que eu possa usar para aprender mais sobre a implementação de vários elementos estatísticos no software?

Thomas Owens
fonte

Respostas:

3

Você pode ler a pergunta extremamente popular no Stack Overflow sobre quais estatísticas um programador ou cientista da computação deve saber .

Jeromy Anglim
fonte
Boa decisão. Eu uso SO e não sabia que essa pergunta existia. É bom ter uma ligação cruzada para os momentos em que perguntas podem aparecer em várias trocas.
Thomas Owens
3

Aqui está um livro muito bom de James E. Gentle, Estatísticas Computacionais (Springer, 2009), que abrange aspectos computacionais e estatísticos da análise de dados. Gentle também é autor de outros grandes livros, confira suas publicações.

Outro grande livro é o Handbook of Computational Statistics , de Gentle et al. (Springer, 2004); está circulando como PDF em algum lugar da Web, então tente vê-lo no Google.

chl
fonte
2

Você mencionou algumas técnicas de ML, então dois livros bastante agradáveis ​​(porque, infelizmente, o meu favorito é em polonês):
http://www.amazon.com/Machine-Learning-Algorithmic-Perspective-Recognition/dp/1420067184
http: / /ai.stanford.edu/~nilsson/mlbook.html

Para coisas numéricas como a geração de números aleatórios:
http://www.nr.com/

user88
fonte
+1 no livro Marsland é muito bom e preencheu uma grande lacuna na seleção existente de livros sobre ML.
quer
1

Peguei uma cópia do Probability and Statistics for Computer Scientists - Michael Baron à venda com outro livro de estatísticas (eu honestamente o comprei por causa do nome - eu queria um livro que analisasse estatísticas da perspectiva da ciência da computação, mesmo que não fosse perfeito). Ainda não tive a chance de ler ou resolver nenhum problema, mas parece um livro sólido.

O prefácio do livro diz que é para estudantes de nível superior e iniciantes, e eu concordo com isso. É necessário algum entendimento de probabilidade e estatística para compreender o conteúdo deste livro.

Os tópicos incluem probabilidade, variáveis ​​aleatórias discretas, distribuições contínuas, métodos de Monte Carlo, processos estocásticos, sistemas de filas, inferência estatística e regressão.

Thomas Owens
fonte
1

Embora não seja especificamente estatística computacional, Um Manual de Análises Estatísticas Usando R - Brian S. Everitt e Torsten Hothorn aborda muitos tópicos que eu já vi abordados em livros estatísticos básicos e intermediários - inferência, ANOVA, regressão linear, regressão logística, estimativa de densidade, particionamento recursivo, análise de componentes principais e análise de cluster - usando a linguagem R. Isso pode ser de interesse para os interessados ​​em programação.

Entretanto, diferentemente de outros livros, a ênfase está no uso da linguagem R para executar essas funções estatísticas. Outros livros que eu vi usam combinações de álgebra e cálculo para demonstrar estatísticas. Este livro realmente se concentra em como analisar dados usando a linguagem R. E para torná-lo ainda mais útil, os conjuntos de dados que os autores usam estão no CRAN - o Repositório R.

Thomas Owens
fonte
1

A computação estatística com R - Maria L. Rizzo cobre muitos dos tópicos em Probabilidade e estatística para cientistas da computação - probabilidade e estatística básicas, variáveis ​​aleatórias, estatística bayesiana, cadeias de Markov, visualização de dados multivariados, métodos de Monte Carlo, testes de permutação, probabilidade estimativa de densidade e métodos numéricos.

As equações e fórmulas utilizadas são apresentadas tanto em fórmulas matemáticas quanto em código R. Eu diria que um conhecimento básico de probabilidade, estatística, cálculo e talvez matemática discreta seria aconselhável para quem quiser ler este livro. Um background de programação também seria útil, mas existem algumas referências para a linguagem R, operadores e sintaxe.

Thomas Owens
fonte
1

Como engenheiro de computação que vem analisando dados, um livro realmente legível que cobre as coisas de uma perspectiva bastante pouco intimidadora e legível (ao custo de não cobrir tanto quanto qualquer outro livro sugerido aqui) foi Programming Collective Intelligence, de Toby Segaran. Achei muito mais acessível do que, por exemplo, o livro de Bishop, que é uma ótima referência, mas é mais aprofundado do que você provavelmente deseja em um primeiro passo. Na amazon: http://www.amazon.com/Programming-Collective-Intelligence-Building-Applications/dp/0596529325

user1076
fonte
1

O CRAN tem vários bons exemplos de livros referentes à programação estatística. Alguns deles não pertencem ao aprendizado de máquina e ao MCMC, mas cada entrada é anotada; portanto, você deve ter uma idéia aproximada do que cada livro contém para aprofundar um pouco mais. http://www.r-project.org/doc/bib/R-books.html

Christopher Aden
fonte