Existe um modelo de visualização bom para mostrar a sobreposição de interseção de muitos conjuntos?
Estou pensando em algo como os diagramas de Venn, mas que de alguma forma podem se prestar melhor a um número maior de conjuntos, como 10 ou mais. A Wikipedia mostra alguns diagramas de Venn de conjuntos mais altos, mas mesmo os quatro diagramas de conjunto são muito úteis.
Meu palpite quanto ao resultado final dos dados seria que muitos dos conjuntos não se sobrepõem, portanto é possível que os diagramas de Venn estejam bem - mas eu gostaria de encontrar uma ferramenta de computador capaz de gerar isso. Parece-me que os gráficos do Google não permitem tantos conjuntos.
data-visualization
dataset
Kyle Brandt
fonte
fonte
Respostas:
Quando você tem um grande número de conjuntos, eu tentaria algo mais linear e mostre os links diretamente (como um gráfico de rede). Flare e Protovis têm utilitários para lidar com essas visualizações.
Veja esta pergunta para alguns exemplos como este:
fonte
Isso não competirá com a resposta de @ Shane, porque as exibições circulares são muito adequadas para exibir relacionamentos complexos com conjuntos de dados de alta dimensão.
venn()
Para referência adicional, você pode estar interessado em
Os diagramas de Venn têm suas limitações, no entanto. A esse respeito, gosto da abordagem adotada por Robert Kosara em Sightings: A Vennerable Challenge , ou com Parallel Sets (mas veja também esta discussão no blog de Andrew Gelman).
fonte
Desenvolvemos uma abordagem baseada em matriz para interseções de conjunto chamada UpSet, você pode conferir em http://vcg.github.io/upset/ . Aqui está um exemplo:
A Matrix à esquerda identifica a interseção que uma linha representa; a última linha aqui, por exemplo, é a interseção dos gêneros de filmes "Ação, Aventura e Crianças". As barras à direita mostram o tamanho da interseção, 4 neste exemplo.
Você também pode plotar atributos dos cruzamentos ou outras seleções, etc. Confira o site para obter detalhes.
Agora também existe uma versão estática para o R, que você pode encontrar no site mencionado acima, ou acessando aqui: https://github.com/hms-dbmi/UpSetR/
Um relatório de última geração sobre visualização de cenários está disponível em http://www.cvast.tuwien.ac.at/SetViz - a maioria deles é acadêmica e não vem com código prontamente disponível.
fonte