Estou muito interessado no potencial da análise estatística para simulação / previsão / estimativa de funções, etc.
No entanto, eu não sei muito sobre isso e meu conhecimento matemático ainda é bastante limitado - eu sou um estudante de graduação em engenharia de software.
Estou procurando um livro que me inicie em algumas coisas sobre as quais continuo lendo: regressão linear e outros tipos de regressão, métodos bayesianos, métodos monte carlo, aprendizado de máquina, etc. Também quero começar com R, portanto, se havia um livro que combinava ambos, isso seria incrível.
De preferência, gostaria que o livro explicasse as coisas conceitualmente e não com muitos detalhes técnicos - gostaria que as estatísticas fossem muito intuitivas para mim, porque entendo que existem muitas armadilhas arriscadas nas estatísticas.
É claro que estou disposto a ler mais livros para melhorar minha compreensão dos tópicos que considero valiosos.
fonte
Para uma combinação de R com muitos dos métodos que você descreve, além do texto de Maindonald e Braun mencionado por Jeremy Anglim, sugiro que você dê uma olhada nesses dois livros de Julian Faraway:
Ambos apresentam introduções razoavelmente simples aos vários tópicos, o último abrange uma vasta gama de abordagens mais modernas para a regressão, incluindo muitas técnicas de aprendizado de máquina, mas o faz em um ritmo mais rápido com menos descrição e ambas exemplificam as técnicas via código R.
Você pode obter um código da seção Livros do site R para obter 20% de desconto no preço sugerido se comprar diretamente da Chapman & Hall / CRC Press, mas verifique o preço da Amazon ou similar para sua região, pois a redução na Amazon é competitiva com o preço do editor após o desconto.
Uma das coisas boas desse par de livros é que eles oferecem uma boa noção dos métodos modernos com detalhes suficientes para explorar as áreas que você deseja detalhar com textos mais especializados.
Parte do conteúdo inserido nesses livros está disponível em PDF online por Julian, na seção Documentos contribuídos do site da R. Convido você a navegar nessa seção para ver se existem outros documentos que podem dar os primeiros passos sem que você precise gastar dinheiro. Uma versão inicial do texto que se transformou na primeira edição do texto de Maindonald e Braun também pode ser encontrada nesta seção.
fonte
Bem, se você deseja uma visão geral da maioria dos métodos estatísticos e o código R para eles, não pode dar muito errado com Venables e Modern Applied Statistics em Venables e Ripley .
É sucinto, lúcido e possui código R suficiente para você iniciar praticamente qualquer tópico estatístico que você queira nomear.
Comprei este livro e fiquei desconfiado sobre o preço versus a contagem de páginas, mas valeu a pena o investimento. Eles assumem cálculo e álgebra linear, mas, como você é um engenheiro, isso não deve ser um problema.
A programação S também é maravilhosa, mas provavelmente não é o que você está procurando no momento.
fonte
Elementos de aprendizado estatístico podem ser pouco intimidadores para iniciantes. Eu recomendaria a leitura " Introdução à aprendizagem estatística com aplicativos em R ", que pode ser baixada gratuitamente a partir daqui -> http://www-bcf.usc.edu/~gareth/ISL/ Também elaborou exemplos em R no final de cada capítulo.
" Aprendizado de máquina: uma perspectiva algorítmica ", de Stephen Marsland, também abrange uma gama mais ampla de tópicos sem se interessar muito pela matemática.
fonte
As respostas anteriores têm muito do lado da aplicação. Quanto ao material conceitual e ao bom pensamento estatístico, eu recomendaria a Teoria da Probabilidade: A lógica da ciência por Edwin Jaynes. Os três primeiros capítulos estão disponíveis gratuitamente aqui
Porém, como os programas de computador não têm muito a ver com programas de computador, o lado da aplicação está nos problemas mais estilizados. Possui um capítulo brilhante sobre os paradoxos da teoria das probabilidades, com uma exceção, o "paradoxo da marginalização", que é resolvido corretamente aqui (embora Jaynes essencialmente "entenda a lição", em que um prior impróprio deve ser o limite de uma sequência de prioros adequados) .
fonte
As sugestões feitas até o momento são excelentes, mas estão focadas nas técnicas mais avançadas e sofisticadas usando o software R. Para uma visão excelente e intuitiva das técnicas multivariadas clássicas, a estrutura subjacente para as abordagens mais atualizadas, incluindo regressão, ANOVA, análise fatorial, análise de cluster, análise discriminante, análise de tabela de contingência e análise de equações estruturais, Multivariada de Dillon e Goldstein Estatisticas publicadas por Wiley nos anos 80 continuam sendo clássicas. É lúcido e aplicado em seus exemplos sem ser excessivamente teórico ou apegado ao software.
Dillon e Goldstein é o livro que eu recomendaria para quem quer entender como os métodos modernos de aprendizado de máquina se originaram.
fonte
Eu recomendaria "Análise de séries temporais e suas aplicações com exemplos R" de Shumway e Stoffer
A terceira edição: http://www.stat.pitt.edu/stoffer/tsa3/
Clique e compre http://www.amazon.com/Time-Analysis-Its-Applications-Statistics/dp/144197864X/ref=dp_ob_title_bk
fonte
O R Cookbook é uma ótima maneira de pular para o R e começar a aprender como usá-lo. É muito prático, por isso é ótimo para aprender a usar a linguagem, mas você também deve procurar um bom livro de teoria.
fonte