Que livro é recomendável começar a aprender estatística usando R ao mesmo tempo?

50

Livros para aprender estatística usando R

Qual é exatamente o livro que estou procurando?

O que eu estou procurando é um livro que ensine estatística enquanto você usa R para lhe proporcionar uma experiência prática e, assim, acaba ajudando você a aprender R juntos. Já vi na Amazon muitos livros que tentam fazer isso, mas não com R. Os exemplos são Minitab e SAS.

O livro R e a computação estatística são uma opção? - Ainda não respondeu .

O livro R e a computação estatística: uma introdução à análise de dados usando o S-Plus parece viável, mas uma opinião do leitor aqui seria útil e bem-vinda.

Como o livro se relaciona com os cursos de estatística?

Para ser ainda mais preciso sobre o que eu estava procurando, considere esses dois cursos aprendendo os resultados das estatísticas de um departamento de matemática da universidade. Atualmente sou aluno:

Estatística intermediária e probabilidade e estatística , ou seja, estou procurando em um livro um curso normal de estatística que vá para o nível intermediário, mas em vez de apenas papel e cartão, para que você aprenda e use R. Isso também significa que estou procurando um livro que suponha que eu queira aprender estatística desde o início.

Este livro também é para pesquisadores.

Também sou pesquisador de engenharia de software, mas acho que a situação atual em que você se encontra com montanhas de dados e deseja aprender estatísticas para continuar escrevendo código para automatizar que é praticamente aplicável a muitos outros campos.

Isso significa que não estou interessado em aprender todos os detalhes de cada propriedade para cada curva, mas estou mais preocupado em entender os dados para o meu domínio de pesquisa, embora não me importe se o livro quiser aprofundar esse assunto. .

Como motivação final, me pego lendo artigos científicos em diferentes tipos de comunidades que reivindicam resultados com base em inferência estatística, enquanto não há provas legíveis se as suposições / restrições estatísticas estão sendo violadas ou não.

Um livro sobre AR que não seja muito sobre estatísticas não garantirá que eu não esteja seguindo essa prática, e também por isso decidi procurar um livro semelhante a um curso de estatística usando R em vez de brincar com um livro de visão geral.

Perguntas relacionadas em Validação cruzada.

Respostas e feedback para esta pergunta.

@Julie

Os livros sugeridos foram poucos que já me deparei, mas são um exemplo que infelizmente não combina comigo:

Estatísticas Introdutórias com R , Usando R para Estatísticas Introdutórias , Estatísticas: Uma Introdução usando R são alguns dos livros que eu já vi na amazon, mas são sobre uma visão geral de estatísticas ou fazem suposições que requerem conhecimento prévio de estatísticas. O problema com os livros de visão geral é principalmente sobre não chamar atenção para as suposições, restrições e fornecer explicações suficientes para resultar na compreensão das informações.

Se você acredita que não há um livro que se encaixe nessa necessidade, ou acha que o livro R ou o Statistical Computing: Uma Introdução à Análise de Dados usando o S-Plus se encaixariam nisso, eu também apreciaria esse tipo de resposta.

@Christopher Aden

Introdução à Probabilidade e Estatística O uso de R parece ser o mais próximo, mas ainda geral do que eu estava procurando.

O que eu esperava era um livro como David S. Moore, The Basics of Statistics, porque:

  • Abrange todos os assuntos estatísticos.
  • Ele usa duas ferramentas, miniTab e outras para fornecer aprendizado prático sobre o método acabado de explicar.
  • Destaca muito as suposições e restrições. Isso é muito importante para um pesquisador que não fez um curso aprofundado de estatística e deseja usá-la. Dificilmente os livros de visão geral os cobrirão, o que é perigoso para os pesquisadores.
    • Você pode ver o índice do livro aqui . Observe como o foco são as estatísticas e o uso da ferramenta é para melhorar a compreensão e fazer com que o aluno saiba como usar as ferramentas para fazer as estatísticas depois de aprender de uma maneira mais fácil. Não é sobre a ferramenta, é sobre estatísticas!

Eu quero exatamente a mesma coisa, mas usando R.

@Gregory Demin

Ele usa R como exemplos de pedagogia, assume que você deseja aprender estatística e, o melhor de tudo, é de código aberto. Infelizmente, não abrange ANOVA nem ANCOVA, ou assuntos mais avançados.

@Peter Ellis

Boa sugestão para um livro que cubra o que se deseja nesta pergunta.

Livros na opinião do autor da pergunta que respondem à pergunta.

@ Peter Ellis e @ Gregory Demin.

Coleção de livros R na Amazon

A discussão da Amazon sobre livros R para diferentes alunos pode ser encontrada aqui .

Vídeo-aulas ensinando Estatística usando R

O Google Tech Talks, de 2007, também motivou essa pergunta e aborda mais sobre mineração de dados em vez de estatísticas, mas usando R juntos aqui .

Oeufcoque Penteano
fonte

Respostas:

15

Acho que uma das razões pelas quais é tão difícil responder a isso é que o R é tão poderoso e flexível que uma introdução real à programação do R vai muito além do que normalmente é necessário em uma introdução à estatística. Os livros que ensinam estatísticas usando MiniTab, JMP ou SPSS estão fazendo coisas relativamente diretas com o software que mal arranha a superfície do que o R é capaz quando se trata de manipulação de dados, simulações, funções personalizadas, etc.

Dito isto, acho que a Estatística Moderna de Wilcox para as Ciências Sociais e Comportamentais: Uma Introdução Prática (2012) é um livro novo e brilhante. Ele não assume nenhum conhecimento estatístico e leva você do zero até uma grande variedade de técnicas modernas e robustas; e assume não muito mais conhecimento de R do que a capacidade de abri-lo e carregar um conjunto de dados. Também abrange muitas das técnicas clássicas, incluindo a ANOVA (mencionada no OP).

Eu veria este livro como o equivalente aos livros que apresentam estatísticas e um pacote de estatísticas como o SPSS ao mesmo tempo. No entanto, ele não ensinará você a programar em R - apenas como fazer análises estatísticas modernas, com ênfase em técnicas robustas que abordam os problemas conhecidos da análise clássica que são marginalizados pela maioria das outras abordagens para o ensino de estatística.

Os três problemas com métodos clássicos que este livro aborda particularmente desde o início são amostras de distribuições de cauda pesada; assimetria; e heterocedasticidade.

Wilcox usa R porque "Em termos de aproveitar as técnicas estatísticas modernas, R domina claramente. Ao analisar dados, é sem dúvida o desenvolvimento de software mais importante durante o último quarto de século. E é gratuito. Embora os métodos clássicos apresentem falhas fundamentais , não é sugerido que sejam completamente abandonados ... Consequentemente, são fornecidas ilustrações sobre como aplicar métodos padrão com R. De particular importância aqui é que, além disso, são fornecidas ilustrações sobre como aplicar métodos modernos usando mais de 900 R funções escritas para este livro ".

Este livro é tão excelente que, depois que compramos uma cópia para o trabalho, comprei minha própria cópia em casa.

Os títulos dos capítulos são:

  1. resumos numéricos e gráficos de dados;
  2. probabilidade e conceitos relacionados;
  3. distribuições amostrais e intervalos de confiança;
  4. testando hipóteses;
  5. regressão e correlação;
  6. métodos de inicialização;
  7. comparando dois grupos independentes;
  8. comparando dois grupos dependentes;
  9. ANOVA unidirecional;
  10. projetos de duas e três vias;
  11. comparar mais de dois grupos dependentes;
  12. comparações múltiplas;
  13. alguns métodos multivariados;
  14. regressão robusta e medidas de associação;
  15. métodos básicos para análise de dados categóricos;

Edição adicional - depois de verificar o exemplo de David Moore do que você está procurando, realmente acho que o livro de Wilcox atende à necessidade.

Peter Ellis
fonte
11
Muito obrigado. Fico feliz em receber outra referência que também está disponível como um tomo para impressão. Vou editar o post principal mais tarde para incluir sua referência, se ninguém fizer isso a essa altura! Realmente muito apreciado. Apenas para confirmar, você quer dizer que ensina a traçar a teoria mencionada? Isso é mais do que bom para mim! Por favor confirme.
Oeufcoque Penteano
Não sei ao certo o que você quer dizer com "traçar a teoria" - mas certamente ele faz uso extensivo de plotagens e possui o código R para fazer todas as teorias que aborda (tanto a inferência estatística quanto a plotagem). Wilcox também fornece seu próprio pacote de funções ou referências a terceiros para abordagens robustas de ponta desenvolvidas nas últimas décadas. Cada técnica vem com exemplos, incluindo código. Editei a resposta para incluir os títulos dos capítulos.
Peter Ellis
Sim, você acertou totalmente! Os trechos de código que me ajudam a fazer toda a teoria sobre R seriam muito bem-vindos e necessários no que estou analisando. Obrigado por fornecer a lista! Eu também precisava de um livro que falasse sobre bootstrap. Já está comprando este livro. Editará a postagem principal em breve.
Oeufcoque Penteano
Eu já estou navegando neste livro. +500 nesta sugestão, EXATAMENTE o que eu estava procurando: Um volume cheio de informações sobre estatísticas e a função apropriada para usá-lo no R (que é gratuito e de código aberto!). É muito barato para o tamanho deste livro e sua singularidade. Não sinta medo de ser das ciências comportamentais. Estou usando, apesar de eu ser um estudante de CS. Achei que os livros de estatísticas comportamentais são ainda mais úteis para mim do que os livros de estatísticas para entender o que está acontecendo. Não estou dizendo que uma estatística pura é inútil, você precisa de uma. Eu usei Paul Meyer (1965).
Oeufcoque Penteano
6

Pode ser "Introdução ao pensamento estatístico" ?

Gregory Demin
fonte
11
Ótima sugestão, considerarei esta uma resposta válida se não houver mais resposta sobre isso, pois essa ainda não cobre conceitos mais avançados como ANOVA (ou pelo menos o que a pesquisa sugere). Ótimo para ser livre, bem ..
Oeufcoque Penteano
4

A publicação de Julie do livro de Verzani é uma ótima opção para quem não tem experiência em R ou estatística. É suave o suficiente para o R e as estatísticas que são usadas pelo departamento de ciências políticas da UC Davis, e esses alunos não têm aulas de programação nem matemática de nível superior. Seu trabalho está disponível no pacote CRAN, simpleR .
Como você é formado em Ciência da Computação, não acho que precise de uma introdução muito gentil ao R. Suponho que você tenha um conhecimento decente sobre estruturas de dados, escopo e por que precisa de um depurador. Para uma perspectiva muito centrada na computação sobre R (mais do que você pode ver em uma classe de programação estatística em um departamento de graduação), consulte The Art of R Programming, de Norm Matloff. Para ver se lhe interessa, Matloff tem uma versão preliminar de rascunho disponível em seu site . Se você gosta do estilo dele, eu recomendaria pegar a cópia final. Ele é professor de CS e escreve o livro mais para um público de CS do que para um público de estatística.
G. Jay Kerns (um cartaz frequente aqui) também tem um livro disponível on-line chamado Introdução à Probabilidade e Estatística Usando R . Pessoalmente, acho que faz um serviço maravilhoso para introduzir as entranhas de R.
Sei que sua pergunta é direcionada para obter respostas direcionadas a um especialista em ciências da computação, mas também leia este tópico: Que livro você recomendaria para cientistas não estatísticos?

Christopher Aden
fonte
11
Acredito que a Introdução à Probabilidade e Estatística Usando R é a mais próxima, mas ainda não a que estou procurando. Estou editando a pergunta em um segundo para fornecer uma referência exatamente do que estou procurando, mas infelizmente usa o miniTab em vez de R. errado) e, novamente, o livro anterior me preocupa em ser rigoroso o suficiente em estatísticas para fazer suposições de antecedentes estatísticos, das quais, infelizmente, eu não tenho. Vou também resumir os pontos principais.
Oeufcoque Penteano
Você está correto sobre o TAoRP - ele coloca mais ênfase na programação do que em aprender estatística. Estou um pouco confuso com sua pergunta. A menos que você queira começar a aprender estatística matemática, você deve fazer algumas suposições e adotá-las com fé - pelo menos brevemente. Você quer um livro que introduz estatísticas, apresenta exemplos em R e não encobre as suposições? A maioria dos livros de introdução fornece alguma intuição por trás das suposições de modelagem, mas pode não formalizar a lógica. Você precisará ler um livro de estatísticas matemáticas para isso, provavelmente.
Christopher Aden
Por favor, veja o livro que acabei de mencionar na minha edição mais recente sobre a questão. Faz exatamente o que eu queria. De fato, a questão surgiu da leitura de partes deste livro. Quero a mesma coisa, mas com R. também destaquei nas balas o que no livro é tão importante da enorme parte da motivação para quem nunca se deparou com o livro. Espero que esteja claro agora. A tabela de conteúdo do livro pode ser visto aqui também whfreeman.com/Catalog/product/...
Oeufcoque Penteano
3

Achei este livro de grande utilidade, mas ele pressupõe algum conhecimento de termos estatísticos básicos, como valor-p, ANOVA, etc.

Este livro oferece uma introdução muito mais suave aos próprios conceitos estatísticos ...

Julie
fonte
+1. O livro de Verzani é uma introdução muito gentil e também está disponível em seu pacote CRAN. O livro de Dalgaard também é legal, e ele certamente fala como especialista, não sendo um estranho no mundo R!
Christopher Aden
@ChristopherAden - que livro você recomendaria para criar uma base sólida para pensar conceitualmente em estatística , sem se aprofundar (de fato) na própria matemática?
Julie
@ Julie, qual é o seu maior? Um dia, em 1979, recebi um livro sobre estatística para estudantes de sociologia de um professor social. Às vezes, eles são mais úteis, embora um professor mencionado na amazon comentários que eles tendem a cometer mais erros, especialmente em fórmulas que é perigoso para os professores que não são muito em estatísticas :(
Oeufcoque Penteano
Julie: Essa é definitivamente uma questão em que estarei analisando para dar melhores recomendações. Aprendi com Estatística: a arte e a ciência de aprender com dados, de Agresti e Franklin. Eu achei a abordagem baseada em aplicativos excelente. Ele não oferece a divisão 50-50 de estatísticas-e-R que o OP queria, então não me preocupei em mencioná-lo. Eu ainda sou um novato em estatísticas, então, leve minhas receitas com um grão de sal.
Christopher Aden
11
Oi Julie. Seria bom se você pudesse fornecer uma citação completa para cada livro em sua resposta. :)
cardeal
1

Um bom livro é produzido pela Universidade de Adelaide e está disponível gratuitamente on-line e como uma compra para uma cópia impressa.

Aprendendo Estatística com R

Ele está muito bem dividido em sua estrutura e abrange uma introdução ao R e uma introdução básica ao Statistics antes de passar para tópicos mais detalhados.

Há uma lista muito profunda de livros no site da R, fornecendo-o como referência, no entanto, atualmente não li os títulos, será atualizado à medida que avançar.

https://www.r-project.org/doc/bib/R-books.html

sayth
fonte
0

Estatísticas de aprendizagem usando R de Randall E. Schumacker será lançado em janeiro de 2014 pela SAGE Publications. Ele contém todo o material no lançamento.

Randy
fonte
3
É bom que as pessoas nos digam sobre seu próprio trabalho. Apreciamos profundamente esse tipo de conhecimento em primeira mão. É mais do que uma boa idéia, no entanto, reconhecer a conexão de alguém com qualquer recomendação: ela dá mais credibilidade à recomendação e fornece o crédito que você merece :-). Talvez você possa aproveitar essa oportunidade, Randy, para ampliar sua resposta, reconhecer sua autoria e dizer mais sobre por que seu livro seria uma ótima opção para os fins estabelecidos na pergunta. E seja bem-vindo ao nosso site!
whuber