Livro para uma visão ampla e conceitual dos métodos estatísticos

12

Estou muito interessado no potencial da análise estatística para simulação / previsão / estimativa de funções, etc.

No entanto, eu não sei muito sobre isso e meu conhecimento matemático ainda é bastante limitado - eu sou um estudante de graduação em engenharia de software.

Estou procurando um livro que me inicie em algumas coisas sobre as quais continuo lendo: regressão linear e outros tipos de regressão, métodos bayesianos, métodos monte carlo, aprendizado de máquina, etc. Também quero começar com R, portanto, se havia um livro que combinava ambos, isso seria incrível.

De preferência, gostaria que o livro explicasse as coisas conceitualmente e não com muitos detalhes técnicos - gostaria que as estatísticas fossem muito intuitivas para mim, porque entendo que existem muitas armadilhas arriscadas nas estatísticas.

É claro que estou disposto a ler mais livros para melhorar minha compreensão dos tópicos que considero valiosos.

Jérôme Le Chatelier
fonte

Respostas:

11
  • Talvez você queira algo como Análise de Dados e Gráficos Usando R: Uma Abordagem Baseada em Exemplos por John Maindonald e W. John Braun

    • Site para livro
    • Amazon com avaliações variadas
    • Eu recomendo porque o livro marca algumas das suas caixas; ensina um pouco de R; fornece uma visão geral de várias técnicas de modelagem diferentes (por exemplo, regressão múltipla, séries temporais, gráficos, modelo linear generalizado etc.) sem entrar em muitos detalhes matemáticos; é bastante aplicado.
  • Concordo com o @Greg Snow que você pode pensar melhor em termos de leitura de vários livros diferentes. Para cada tópico que você mencionou (por exemplo, estatísticas bayesianas, séries temporais, simulações, R, aprendizado de máquina), existem bons livros dedicados a esse tópico específico. Você pode fazer perguntas separadas sobre o que seria um bom livro, considerando seus interesses particulares nesse tópico.

  • Boas opções on-line disponíveis gratuitamente

    • O Elements of Statistical Learning é um excelente livro e está disponível online gratuitamente. Na sua postagem, tenho a sensação de que pode ser um pouco mais técnico do que você deseja a princípio, mas confira e veja o que você pensa. Talvez você esteja pronto para isso agora; talvez mais tarde.
    • Os Modelos e Dados Ecológicos de Benjamin Bolker em R são outro bom. É da perspectiva da ecologia, mas explica claramente a simulação e o ajuste do modelo de uma perspectiva relativamente não técnica; e tudo está implementado em R. Você pode ver todo o código R no site. Você pode até ver os documentos Sweave usados ​​para gerar o livro!
    • Há uma boa lista de documentação R gratuita no CRAN, com alguns documentos também fornecendo instruções mais amplas sobre estatísticas.
Jeromy Anglim
fonte
5

Um único livro que incluísse todos esses tópicos seria bastante impressionante e provavelmente pesa mais do que você. É como pedir um único livro que ensine programação básica, C, Java, Perl e design avançado de banco de dados em um único livro (na verdade, provavelmente mais, mas eu não conheço termos suficientes de engenharia de software para adicionar alguns mais avançados) .

A regressão em si geralmente é pelo menos um curso completo da faculdade, as estatísticas bayesianas exigem um curso ou 2 de teoria antes de fazer o curso bayesiano para entender completamente, etc.

Não existe um caminho rápido e fácil para o que você está tentando fazer. Eu sugeriria fazer alguns bons cursos na sua universidade e trabalhar a partir daí.

Houve outras discussões sobre bons livros que você pode procurar por algumas idéias.

Greg Snow
fonte
Obrigado pela sua resposta. No entanto, não estou tentando entender tudo sobre tudo, desde um livro, mas ler, digamos, 50 páginas sobre regressão definitivamente me ajudaria muito a ter pelo menos uma compreensão razoável desse assunto ...
Jérôme Le Chatelier
5

Para uma combinação de R com muitos dos métodos que você descreve, além do texto de Maindonald e Braun mencionado por Jeremy Anglim, sugiro que você dê uma olhada nesses dois livros de Julian Faraway:

Ambos apresentam introduções razoavelmente simples aos vários tópicos, o último abrange uma vasta gama de abordagens mais modernas para a regressão, incluindo muitas técnicas de aprendizado de máquina, mas o faz em um ritmo mais rápido com menos descrição e ambas exemplificam as técnicas via código R.

Você pode obter um código da seção Livros do site R para obter 20% de desconto no preço sugerido se comprar diretamente da Chapman & Hall / CRC Press, mas verifique o preço da Amazon ou similar para sua região, pois a redução na Amazon é competitiva com o preço do editor após o desconto.

Uma das coisas boas desse par de livros é que eles oferecem uma boa noção dos métodos modernos com detalhes suficientes para explorar as áreas que você deseja detalhar com textos mais especializados.

Parte do conteúdo inserido nesses livros está disponível em PDF online por Julian, na seção Documentos contribuídos do site da R. Convido você a navegar nessa seção para ver se existem outros documentos que podem dar os primeiros passos sem que você precise gastar dinheiro. Uma versão inicial do texto que se transformou na primeira edição do texto de Maindonald e Braun também pode ser encontrada nesta seção.

Restabelecer Monica - G. Simpson
fonte
3

Bem, se você deseja uma visão geral da maioria dos métodos estatísticos e o código R para eles, não pode dar muito errado com Venables e Modern Applied Statistics em Venables e Ripley .

É sucinto, lúcido e possui código R suficiente para você iniciar praticamente qualquer tópico estatístico que você queira nomear.

Comprei este livro e fiquei desconfiado sobre o preço versus a contagem de páginas, mas valeu a pena o investimento. Eles assumem cálculo e álgebra linear, mas, como você é um engenheiro, isso não deve ser um problema.

A programação S também é maravilhosa, mas provavelmente não é o que você está procurando no momento.

richiemorrisroe
fonte
2

Elementos de aprendizado estatístico podem ser pouco intimidadores para iniciantes. Eu recomendaria a leitura " Introdução à aprendizagem estatística com aplicativos em R ", que pode ser baixada gratuitamente a partir daqui -> http://www-bcf.usc.edu/~gareth/ISL/ Também elaborou exemplos em R no final de cada capítulo.

" Aprendizado de máquina: uma perspectiva algorítmica ", de Stephen Marsland, também abrange uma gama mais ampla de tópicos sem se interessar muito pela matemática.

Siddhesh
fonte
1

As respostas anteriores têm muito do lado da aplicação. Quanto ao material conceitual e ao bom pensamento estatístico, eu recomendaria a Teoria da Probabilidade: A lógica da ciência por Edwin Jaynes. Os três primeiros capítulos estão disponíveis gratuitamente aqui

Porém, como os programas de computador não têm muito a ver com programas de computador, o lado da aplicação está nos problemas mais estilizados. Possui um capítulo brilhante sobre os paradoxos da teoria das probabilidades, com uma exceção, o "paradoxo da marginalização", que é resolvido corretamente aqui (embora Jaynes essencialmente "entenda a lição", em que um prior impróprio deve ser o limite de uma sequência de prioros adequados) .

probabilityislogic
fonte
2
Eu também adorei este livro, mas não tenho certeza de que é o lugar para começar a tentar criar uma intuição para as estatísticas. É um texto bastante polêmico e idiossincrático.
Ben Lauderdale
1

As sugestões feitas até o momento são excelentes, mas estão focadas nas técnicas mais avançadas e sofisticadas usando o software R. Para uma visão excelente e intuitiva das técnicas multivariadas clássicas, a estrutura subjacente para as abordagens mais atualizadas, incluindo regressão, ANOVA, análise fatorial, análise de cluster, análise discriminante, análise de tabela de contingência e análise de equações estruturais, Multivariada de Dillon e Goldstein Estatisticas publicadas por Wiley nos anos 80 continuam sendo clássicas. É lúcido e aplicado em seus exemplos sem ser excessivamente teórico ou apegado ao software.

Dillon e Goldstein é o livro que eu recomendaria para quem quer entender como os métodos modernos de aprendizado de máquina se originaram.

Mike Hunter
fonte
0

O R Cookbook é uma ótima maneira de pular para o R e começar a aprender como usá-lo. É muito prático, por isso é ótimo para aprender a usar a linguagem, mas você também deve procurar um bom livro de teoria.

Zach
fonte