Recursos para aprender a usar (/ criar) visualização estatística dinâmica (/ interativa)

14

Gostaria de aprender um pouco mais sobre a visualização interativa de dados (zoom, apontar, escovar, mapear pontos e assim por diante). Gostaria de receber qualquer:

  1. Tutorial / guia / livro (?) / Vídeo sobre como usar esses métodos para exploração estatística.
  2. Ponteiros para pacotes de visualização de dados interativos bons / interessantes (em R e fora dele)

Só para começar a bola rolando, eu sei que no R existem várias maneiras de obter visualização interativa, como rggobi , o novo pacote googleViz R , o pacote de animação e outros. Mas se houver outros pacotes que valham a pena explorar (oferecendo coisas que o R não oferece), ficaria feliz em saber sobre eles (como jmp, mathlab, spss, sas, excel e assim por diante).

ps: esta é a primeira pergunta para usar a tag "visualização interativa"

Tal Galili
fonte
Acho que o @Shane terá algo a dizer aqui enquanto fala sobre o webvis (analisador de protovis), já que o protovis (dedicado à visualização na web) ( vis.stanford.edu/protovis ) contém a possibilidade de gráficos interativos ...
robin girard
No R, também existem iPlots e Rgl , mas as soluções baseadas em Javascript ou Python podem ser mais flexíveis.
Vincent Zoonekynd

Respostas:

13

Além do Protovis (HTML + JS) ou Mayavi (Python), eu recomendaria o Processing, que é

uma linguagem de programação e ambiente de código aberto para pessoas que desejam criar imagens, animações e interações. Inicialmente desenvolvido para servir como um caderno de desenho de software e para ensinar os fundamentos da programação de computadores em um contexto visual.

Existem muitos scripts de código aberto em http://www.openprocessing.org/ e muitos livros relacionados que lidam com o Processing, mas também com a visualização de dados.

Eu sei que existe um projeto para fornecer uma interface R, reprocessamento , mas não sei como isso acontece. Há também uma interface com o clojure / incanter (consulte Por exemplo, Criando visualizações de processamento com o Clojure e o Incanter ).

Existem muitos recursos on-line, entre os quais notas da classe Stanford, por exemplo, CS448B ou 7 documentos clássicos visuais fundamentais que você pode não querer confessar publicamente que não conhece .

chl
fonte
6

Mais alguns pacotes para adicionar à sugestão de Processamento de Chl para criar visualizações interativas. Todos estes são baseados em javascript e podem ser executados em um navegador; portanto, podem ser usados ​​para publicação e para sua própria análise:

  • D3.js é o sucessor do Protovis. É mais poderoso porque você tem mais controle sobre os objetos criados (eles são objetos DOM apropriados, ou seja, você tem controle total sobre eles usando javascript), mas alguns preferem o Protovis por simplicidade. Boa discussão técnica entre D3 e Protovis aqui .
  • Raphael.js é uma boa opção para interatividade da Web de mercado de massa altamente personalizada, pois é à prova de futuro (sem flash) e funciona em navegadores tão antigos quanto o IE6 (a única coisa na qual não funciona e que conheço são as versões antigas do o navegador Android). Como o D3, tudo é um objeto DOM segmentável e possui bons controles de API construídos para animação e interatividade. Ele não oferece nada de imediato que seja específico para a visualização: é uma folha em branco muito poderosa e flexível, uma ótima opção para projetar visualizações personalizadas, mas não para sua própria análise exploratória inicial. Familiarize-se com seus dados primeiro.
  • gRaphael.js são gráficos padrão (barra, linha etc.) para o Raphael. É básico, mas funciona e pode ser construído - pode ser um ingrediente útil se você estiver construindo seu próprio conjunto.

Em relação à sua outra pergunta sobre aprendizado, por princípios gerais, o Information Dashboard Design merece uma menção, se o que você deseja é criar uma variedade de ferramentas padrão interativas de uso geral para seus dados.

As visualizações interativas estão na linha entre estatísticas e design de interatividade : portanto, livros sobre isso podem ser úteis. Não tenho nenhuma experiência pessoal em nenhum dos muitos livros didáticos de design de interação, mas sou um grande fã dos Princípios Universais de Design . Pode ser um exagero para as suas necessidades, mas considere consultar a coluna Usabilidade em sua excelente página de Conteúdos Categóricos e ler os capítulos listados (divulgação progressiva, sinal para ruído etc.).

Além disso, para quem é iniciante em programação, Interatividade de programação é iniciante em é um bom ponto de partida para aprimorar as habilidades técnicas (inclui também um capítulo robusto sobre Processamento).

Mas, para saber o que funciona e o que é possível, você não pode superar o aprendizado fazendo , e um bom ponto de partida pode ser considerar rastrear e analisar os pacotes de visualização interativa de uso geral de grande nome e preço alto, como tableau e jmp e pense por que seus recursos foram projetados da maneira que são.

user56reinstatemonica8
fonte
Obrigado por editar nos links whuber - me derrote!
usar o seguinte código
4

Além do Processing, confira o Nodebox baseado em Python (1, 2, OpenGL), inspirado no Processing:

O Nodebox 1 é apenas para Mac, enquanto o Nodebox 2 e a versão OpenGL são multiplataforma.

O Python possui várias bibliotecas de processamento de dados que podem ser importadas para o Nodebox, por exemplo, scipy.org

Ed Hagen
fonte
1

Como uma abordagem separada das respostas existentes, logo após eu postar minha primeira lista longa, surgiu o WEAVE : um conjunto de visualização de dados de código aberto dedicado. Aqui está uma breve descrição sobre o WEAVE no site líder de dados do Flowing Data

É aconselhável adotar uma abordagem diferente para a visualização de dados, dependendo de onde você está no processo. Quanto mais cedo você estiver - quanto mais brutos e inexplorados seus dados -, maior será a probabilidade de você se beneficiar de pacotes pré-construídos, flexíveis e de uso geral, como o WEAVE e de parceiros comerciais de código fechado, como o Tableau e o JMP - você poderá experimentar as coisas rapidamente e indolor para conhecer os dados e descobrir quais linhas de ataque tomar para tirar o máximo proveito deles.

À medida que você descobre mais sobre os dados, é provável que seu foco mude para a comunicação ou 'exploração guiada' - visualizações de dados exploratórias mais personalizadas, projetadas com base nas advertências, nuances e áreas de interesse que você descobriu nos dados. É aqui que os produtos em branco da ardósia, como as ferramentas de desenho vetorial programático listadas acima, se destacam.

user56reinstatemonica8
fonte