Estou tentando visualizar alguns dados do consumidor, que tem quatro categorias. Os usuários podem alternar entre diferentes categorias. Gostaria de visualizar os últimos três ou quatro comutadores para cada indivíduo.
Então começamos com um gráfico com uma coluna com 4 proporções empilhadas. Depois disso, teríamos 16, conforme cada categoria se decompõe no que as pessoas fizeram na ocasião anterior, 64 e assim por diante, até que as caixas se tornem muito pequenas para serem úteis.
Estou pensando que algo entre um gráfico marimekko e um gráfico de barras empilhado ou um grama dendro deve funcionar, mas eu nem sei como isso seria chamado!
Se alguém puder ajudar com o tipo de plot que eu devo usar e, se você quiser ser mais gentil, como implementá-lo no R, ficaria muito grato.
fonte
Respostas:
Uma ideia potencial é o uso dos diagramas de Sankey para documentar o fluxo de opções entre as categorias. Dois exemplos para descrever o que estou falando são;
Com uma atualização sobre algumas de suas preocupações expressas nos comentários. Parece-me que o programa Parallel Sets faz o que você deseja fora da caixa. Abaixo está uma saída do programa, na qual criei 4 variáveis aleatórias com 4 categorias. Qualquer grupo que você inicializar na parte superior da exibição será dividido seqüencialmente entre as categorias subseqüentes. Criando a divisão que você deseja.
Também não é aparente nesta figura, o pacote possui algumas funcionalidades interativas que permitem uma análise exploratória mais fácil dos dados, como quando você passa o mouse sobre uma das categorias, todos os seus descendentes são destacados.
dec1
dec4
exp
dec
dec3_exp12
121
dec1 = 1 and dec2 = 2 and dec3 = 1
Depois de brincar mais com o Fineo, é uma aplicação interessante, mas é realmente limitada. Conjuntos Paralelos tem muito mais funcionalidade, então eu sugiro que você verifique isso antes do aplicativo Fineo.
Eu acho que o programa ParSets é uma opção muito melhor do que dividir sucessivamente as categorias em subconjuntos para exame. Por exemplo, usando os mesmos dados aleatórios acima, aqui está um gráfico de pontos que representa as categorias de proporção em
decision 2
condicional escolhido na categoria escolhida paradecision 1
.Você pode fazer o mesmo detalhamento para a alteração de
decision 2
paradecision 3
, mas faça um pequeno gráfico múltiplo para o quedecision 1
era inicial .Você pode continuar isso infinitamente (veja abaixo). Pode ser esclarecedor, mas suspeito que seria bastante assustador quando você chegasse a muitos outros painéis. Abaixo, conforme solicitado, visualizando 4 opções de categoria sucessivas.
Como observado anteriormente, os pequenos números no momento em que você divide seu gráfico em tantas categorias são problemáticos. Uma maneira de explicar isso é mapear uma estética, como tamanho, para a linha de base na qual a proporção se baseia. Isso reduz as observações com base em números menores da visualização. Você também pode usar a transparência (mas eu já tornei os pontos transparentes para distinguir pontos com excesso de plotagem neste exemplo).
Eu imagino que alguns estavam visualizando uma árvore de Natal como estrutura de nós, em oposição a pontos, mas não sei como fazer esse gráfico. Eu suspeito que seria suspeito do mesmo problema avassalador. Esses múltiplos pequenos não são ruins, mas o IMO the Parallel Sets é muito mais intuitivo e suspeito que alguns padrões não óbvios seriam mais aparentes nessa visualização. Talvez alguém mais imaginativo do que eu possa apresentar alguns dados mais interessantes do que apenas quatro categorias aleatórias.
fonte