Costumo lidar com uma quantidade de tamanho razoável de dados de séries temporais, 50 a 200 milhões de vezes com registros de data e hora associados e gostaria de visualizá-los dinamicamente.
Existe software existente para fazer isso de forma eficaz? E as bibliotecas e formatos de dados? O cache de zoom é um exemplo de biblioteca focada em grandes séries temporais. No cache Zoom, os dados são resumidos em várias resoluções para facilitar a visualização em diferentes resoluções.
Edit: Além disso, se houver algum outro lugar eu deveria fazer esta pergunta ou procurar uma resposta, por favor me avise.
Respostas:
Há um conjunto de ferramentas de pesquisa chamado TimeSearcher 1--3 que fornece alguns exemplos de como lidar com grandes conjuntos de dados de séries temporais. Abaixo estão alguns exemplos de imagens do TimeSearcher 2 e 3.
fonte
Desculpe pelo auto-anúncio, mas o Thunderplot (thunderplot.com) seria um bom candidato. Eu escrevi exatamente para plotagem interativa de grandes conjuntos de dados. Não testei com conjuntos de dados de linhas de 200KK, mas funciona bem com ~ 10KK linhas. Além disso, há o recurso "ler cada enésima linha", para que você possa reduzir a quantidade de dados para armazenar / visualizar. Posso enviar a chave de registro em troca de um desses grandes conjuntos de dados. :-)
fonte
Outro post de autopromoção, porque trabalho para esta empresa, mas o SensorCloud (sensorcloud.com) usa algoritmos inteligentes para representar graficamente conjuntos de dados em massa muito rapidamente. Ele foi originalmente projetado com nossos sensores físicos em mente, mas possui um carregador CSV para lidar com quaisquer dados de séries temporais.
Por exemplo, fizemos o upload de um conjunto de dados com 100 bilhões de pontos de dados (mais de 1 terabyte de carimbo de data e hora + valores de dados) e você pode fazer um gráfico e interagir com ele muito rapidamente.
Aqui está um link público para esse conjunto de dados: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/
O link acima usa nosso visualizador em flash. Se você não quiser usar o flash, aqui está o visualizador de javascript: https://sensorcloud.microstrain.com/SensorCloud/data/Z3MFURATHIB8A032/js/
Use a roda de rolagem ou Shift + clique esquerdo para aumentar o zoom.
fonte