Recentemente, me deparei com o Tableau e tentei visualizar os dados do banco de dados e do arquivo csv. A interface do usuário permite que ele visualize tempo e dados espaciais e crie gráficos em um instante. Essa ferramenta é realmente útil, pois permite observar os dados graficamente sem escrever o código.
Como existem muitas fontes de dados das quais eu tenho que recuperar e visualizar os dados, seria muito útil ter uma ferramenta que permitisse gerar gráficos simplesmente arrastando colunas nos eixos e modificando adicionalmente a visualização, arrastando também os nomes das colunas.
Alguém conhece algum software livre ou de código aberto desse tipo?
Respostas:
Eu nunca tentei, mas há um conjunto de visualização de código aberto baseado em desktop / navegador chamado WEAVE (abreviação de Analysis and Visualization Environment, baseado na Web). Como o Tableau, ele visa explorar dados por meio de uma interface interativa baseada em cliques. Ao contrário do Tableau, é de código aberto: você pode fazer o download do código-fonte e instalar sua própria versão em sua própria máquina, que pode ser tão privada ou pública quanto você deseja. Não espere nada quase tão liso e user-friendly como Tableau, mas parece que um interessante, projeto poderoso para alguém preparado para colocar o tempo para aprender a usá-lo.
Ou então, você pode criar o seu próprio . Existem algumas boas ferramentas de javacript de código aberto para oferecer suporte à visualização de dados de programação em um navegador. Se você não se importa em codificar algum Javascript e algum tipo de camada do servidor para exibir os dados, tente:
Raphael, se você precisar que a saída SVG funcione no Internet Explorer 6, 7 e 8.
Se você está interessado na opção de programação na web, aqui está um artigo um pouco mais detalhado que escrevi no Raphael e no D3 para o stackoverflow .
Também existem alguns conjuntos de datavis online gratuitos (não de código aberto) que vale a pena mencionar (provavelmente não adequados para conexão direta ao banco de dados, mas que valem uma olhada):
E algo completamente diferente: se você tem um servidor de qualidade por aí e deseja criar mapas 'slippy' incríveis baseados em mosaicos no estilo google-maps usando tecnologia de código aberto (provavelmente não é o que você está procurando - mas é possível! ), confira MapBox TileMill . Dê uma olhada na galeria de exemplos em sua página inicial - alguns deles são realmente impressionantes. Veja também o projeto relacionado Modest Maps , uma biblioteca Javascript de código aberto para interagir com mapas desenvolvidos pela Stamen Design (uma agência realmente altamente qualificada e especializada em mapas interativos). É considerado uma melhoria nos OpenLayers mais estabelecidos. Todo o código aberto.
O WEAVE é a melhor ferramenta de código aberto baseada em GUI que conheço para análise visual pessoal .
As outras ferramentas listadas são ferramentas topo de gama para publicação on-line de visualizações (por exemplo, o D3 é usado e desenvolvido pela premiada equipe gráfica do NY Times ) e são mais frequentemente usadas para visualização no contexto do público. comunicações do que a análise exploratória, mas elas também podem ser usadas para análise.
fonte
As interfaces de apontar e clicar parecem mais fáceis, mas, a longo prazo, você se beneficiará ao aprender "escrever o código".
Uma vantagem dos sistemas baseados em script nas interfaces de apontar, clicar e arrastar é a trilha / histórico de auditoria (algumas GUIs possuem um histórico, mas geralmente não são tão fáceis de trabalhar quanto um script salvo). Se você escrever algum código para criar seu gráfico e salvá-lo, é sempre fácil executá-lo novamente ou, em seguida, executar algumas pequenas edições, nem sempre é fácil lembrar o conjunto de cliques e arrastamentos usados para criar um gráfico anterior.
Os scripts também serão muito mais rápidos para um grande número de plotagens. Levará um pouco mais de tempo para escrever o código para o primeiro gráfico, mas adicionar apenas algumas linhas e algumas pequenas modificações pode fazer você percorrer centenas ou mais variáveis com pouco esforço adicional, onde é necessário fazer o mesmo conjunto de cliques e arrasta repetidamente para cada parcela.
Muitas das ferramentas de plotagem baseadas em script possuem GUIs que permitem usar apontar e clicar para começar, mas ajudam a aprender o código e a transição para os métodos mais avançados.
Eu recomendo o R, que é gratuito e de código aberto e tem algumas GUIs disponíveis (Rcmdr, jgr, rstudio, etc.) como uma boa opção.
fonte
O RapidMiner tem boas visualizações:
http://rapid-i.com/component/option,com_myblog/show,New-Plotters-for-RapidMiner.html/Itemid.172/lang,en/
E, claro, existe o R + ggplot2, usando uma interface da web ou um front-end gráfico:
http://labs.dataspora.com/ggplot2/
http://www.deducer.org/pmwiki/index.php?n=Main.PlotBuilder
fonte
Você pode usar o serviço de nuvem gratuito em https://my.infocaptor.com/free_data_visualization.php
A versão online permite fazer o upload de qualquer dado csv / excel e visualizá-lo rapidamente. Você não precisa fazer login para isso. Se você deseja trabalhar com bancos de dados, precisará fazer login ou fazer o download do software.
PS: faço parte da empresa que fabrica este produto
fonte
Eu usaria o programa de análise e visualização de dados SCaVis . É escrito em Java e é executado em qualquer plataforma, incluindo Mac e Linux. Você também pode criar protótipos de gráficos usando Python.
fonte
Existe uma nova ferramenta chamada Helical Insight, que é uma ferramenta de BI de código aberto, com a qual você pode criar gráficos, relatórios, painéis e várias visualizações de dados. Com isso, você pode criar relatórios de duas maneiras: BI de autoatendimento e BI instantâneo. No BI de autoatendimento, você arrasta e solta as colunas que deseja, adiciona filtros para, finalmente, criar insights. 'Instant BI' é um recurso no qual você pode digitar qualquer pergunta comercial e obter informações instantâneas de acordo. No que diz respeito à visualização de dados, você pode ter gráficos simples embutidos, gráficos científicos e também é muito importante incorporar seu próprio gráfico nele. Visite www.helicalinsight.com
fonte
Na verdade, há uma resposta correta para essa pergunta, Orange . Já era em torno de 2. algo lançado no momento em que a pergunta foi postada. Em sistemas baseados em Linux pode simplesmente ser instalado através do Python Package Index com
pip install orange3
e é também no Arch User Repository para o Arch Linux, Manjaro, alarme e outras distros baseadas em Arch.Além disso, existe praticamente a mesma pergunta no StackExchange mencionando mais algumas alternativas comerciais / da Web (que estão fechadas e com links aqui). Um pouco mais pode ser encontrado no Quora , mas Orange é o único código-fonte aberto, compilado e com uma GUI ao mesmo tempo que eu conheço. Ele tem uma interface bastante aperfeiçoada, estética e minimalista na minha opinião.
fonte
Talvez http://www-958.ibm.com/software/data/cognos/manyeyes/ seja o que você deseja. Lembre-se de que os dados enviados são públicos. Edit: Desculpe, vejo que você pediu código aberto. Minha culpa.
fonte
Há também um programa jovem para leitura (automatizada), filtrar, processar, interpolar e plotar valores n-dimensionais de diferentes fontes (como arquivos libreOffice ou csv) e tamanho variável: diaGrabber .
Você precisa usar alguns comandos python simples para criar um caso. Depois disso, você pode manipular a saída gráfica em uma GUI interativa .
fonte