Sucessor moderno da Análise Exploratória de Dados por Tukey?

52

Eu tenho lido o livro de Tukey "Análise Exploratória de Dados". Sendo escrito em 1977, o livro enfatiza os métodos de papel / lápis. Existe um sucessor mais "moderno" que leva em conta que agora podemos traçar instantaneamente grandes conjuntos de dados?

biofreezer
fonte
deve ser este wiki da comunidade?
227126 richardorrisroe
Não está claro para mim se isso deve ser CW. Pode não haver boas respostas; pode haver uma resposta clara e destacada; podemos gerar uma longa lista de respostas eficazes. Vamos ver o que acontece.
whuber
4
Esta é uma boa pergunta, biofreezer. Eu só queria observar que existem analogias estreitas com outros métodos de trabalho. Meu favorito é que caneta e papel A EDA é para estatísticas modernas, assim como as ferramentas manuais para madeira moderna. (A madeira "moderna" emprega muitas ferramentas elétricas, como serras de mesa e roteadores, que permitem que mesmo iniciantes produzam resultados aceitáveis ​​em muito menos tempo. No entanto, essas ferramentas também representam milhares de dígitos e membros ausentes todos os anos. Pessoas que aprendem a usar ferramentas manuais geralmente aprender a trabalhar melhor e de forma mais eficiente, mesmo quando eles empregam ferramentas eléctricas).
whuber
4
Sim, trabalhar madeira é uma boa analogia (dígitos ausentes, dígitos ausentes). Veja também software-carpentry.org .
Denis

Respostas:

19

O mais próximo são os dados de visualização de Cleveland . É sobre Análise Exploratória de Dados, é sobre visualizações geradas por computador, é profundo, é um clássico.

Carlos Accioly
fonte
2
O mesmo se aplica ao livro The Elements of Graphing Data do mesmo autor. Compre os dois; ambos são excelentes.
Karl Ove Hufthammer 02/02
5

O livro ggplot2 de Hadley Wickham é interessante porque ensina gramática dos gráficos e como usar o software ggplot2.

Jack Tanner
fonte
4

Vale a pena mencionar aqui os dados Explorando dados de engenharia, ciências e medicina de Ronald Pearson . Seu principal público-alvo parece ser cientistas que não têm medo de um pouco de matemática que desejam conhecer mais estatísticas. Esse é um grupo bastante grande, e um bem representado aqui. É um pouco peculiar e excêntrico, mas cobre muito terreno e inclui muitos conselhos sensatos. Não é Tukey revisitado no sentido de oferecer muitas idéias novas, mas pode ser gratificante estudar, mesmo quando você pensa que é um pouco errado.

Este livro parece ter atraído muito pouca atenção, possivelmente porque é muito caro, não é obviamente adequado como texto do curso e ainda está disponível apenas em capa dura. Mas é inteligente, legível e livre do lixo dos modernos livros introdutórios (páginas e páginas de exercícios elementares, ícones bobos, fotos gratuitas de jovens felizes, layout exigente com caixas, o que for, etc.).

Nick Cox
fonte
0

Outros bons livros para ler são Beautiful Visualization e Beautiful Data. São livros editados, há exemplos surpreendentemente bons de exploração de dados com gráficos e alguns capítulos absolutamente terríveis.

Outro livro que tem alguns bons exemplos de uso do ggplot2 é um novo de Winston Chang

Dianne Cook
fonte
11
Eu só quero checar, Di, caso ocorra um erro de digitação sutil: você quis dizer escrever "atraente" em vez de "terrível"? Embora ambos façam sentido nesse contexto, a aparência do último - sem maiores explicações - é uma surpresa!
whuber
2
terrível era correcto - isto é uma sacola - volumes editados frequentemente são
Dianne cozinheiro
Estou surpreso com essas recomendações. Achei os dois livros principalmente decepcionantes (muito tempo para rir, pouco gráficos). Infelizmente, O'Reilly, que encontrei pela primeira vez como editora de livros Unix espetacularmente bons, parece ter um controle de qualidade muito desigual para livros sobre qualquer coisa que seja remotamente estatística.
Nick Cox
Gosto dos dois livros e realmente sinto que são contribuições substanciais. O Winston Chang's tem muitos detalhes básicos sobre plotagem com o ggplot2. É uma boa referência para iniciantes. Não diz muito sobre o porquê de você fazer esses enredos, mas a maioria faz sentido para o propósito, a partir das peças que li. A Beautiful Visualization possui alguns capítulos muito impressionantes, abordando problemas difíceis como a visualização de wikipedia, dados maciços, muitas complexidades e passa pelo processo de pensamento / decisões tomadas para fazer as tramas.
Dianne Cook
Apenas no caso de meu comentário ser ambíguo: eu estava me referindo aos livros "Beautiful". O livro de Winston Chang é agradável e útil.
Nick Cox
0

Penso em Entendendo a análise robusta e exploratória de Hoaglin, Mosteller e Tukey e o volume complementar em Explorando tabelas e formas de dados como o acompanhamento técnico da EDA. Também vejo a análise e a regressão de dados, um segundo curso de estatística de Mosteller e Tukey como acompanhamento da EDA. Os vários livros de Cleveland mencionados acima são tesouros.

SJC
fonte