Eu tenho lido o livro de Tukey "Análise Exploratória de Dados". Sendo escrito em 1977, o livro enfatiza os métodos de papel / lápis. Existe um sucessor mais "moderno" que leva em conta que agora podemos traçar instantaneamente grandes conjuntos de dados?
data-visualization
references
descriptive-statistics
eda
biofreezer
fonte
fonte
Respostas:
O mais próximo são os dados de visualização de Cleveland . É sobre Análise Exploratória de Dados, é sobre visualizações geradas por computador, é profundo, é um clássico.
fonte
Bem, não é uma réplica exata, mas encontrei toneladas de conselhos úteis sobre plotagem (e código R) na análise de dados de Gelman e Hill usando regressão e modelos hierárquicos / multiníveis
Além disso, seu blog costuma receber conselhos úteis sobre gráficos.
fonte
Gráficos interativos para análise de dados: princípios e exemplos é um que eu gosto; a descrição do livro diz que "discute a análise exploratória de dados (EDA) e como os métodos gráficos interativos podem ajudar a obter insights, bem como gerar novas perguntas e hipóteses a partir de conjuntos de dados".
fonte
O livro ggplot2 de Hadley Wickham é interessante porque ensina gramática dos gráficos e como usar o software ggplot2.
fonte
Vale a pena mencionar aqui os dados Explorando dados de engenharia, ciências e medicina de Ronald Pearson . Seu principal público-alvo parece ser cientistas que não têm medo de um pouco de matemática que desejam conhecer mais estatísticas. Esse é um grupo bastante grande, e um bem representado aqui. É um pouco peculiar e excêntrico, mas cobre muito terreno e inclui muitos conselhos sensatos. Não é Tukey revisitado no sentido de oferecer muitas idéias novas, mas pode ser gratificante estudar, mesmo quando você pensa que é um pouco errado.
Este livro parece ter atraído muito pouca atenção, possivelmente porque é muito caro, não é obviamente adequado como texto do curso e ainda está disponível apenas em capa dura. Mas é inteligente, legível e livre do lixo dos modernos livros introdutórios (páginas e páginas de exercícios elementares, ícones bobos, fotos gratuitas de jovens felizes, layout exigente com caixas, o que for, etc.).
fonte
Também gráficos interativos e dinâmicos para análise de dados: com exemplos usando R e GGobi, Cook e Swayne
Isso tem dois capítulos disponíveis publicamente na web que descrevem o processo de análise de dados e o tratamento de valores ausentes. Um novo livro será lançado por Antony Unwin em breve.
fonte
Outros bons livros para ler são Beautiful Visualization e Beautiful Data. São livros editados, há exemplos surpreendentemente bons de exploração de dados com gráficos e alguns capítulos absolutamente terríveis.
Outro livro que tem alguns bons exemplos de uso do ggplot2 é um novo de Winston Chang
fonte
Penso em Entendendo a análise robusta e exploratória de Hoaglin, Mosteller e Tukey e o volume complementar em Explorando tabelas e formas de dados como o acompanhamento técnico da EDA. Também vejo a análise e a regressão de dados, um segundo curso de estatística de Mosteller e Tukey como acompanhamento da EDA. Os vários livros de Cleveland mencionados acima são tesouros.
fonte