Digamos que eu possua os seguintes dados quadridimensionais, nos quais os três primeiros podem ser considerados como coordenadas e o último pode ser considerado como valores.
c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95
Como visualizar melhor o efeito das três primeiras coordenadas no último valor?
Estou ciente de três métodos.
Uma é a plotagem 3D para as três primeiras coordenadas com o tamanho de pontos como o valor quatro. Mas não é tão fácil ver a tendência nos dados.
Outro está usando uma série de plotagem 3D, cada uma com uma coordenada fixa.
Outro pode ser um chamado "gráfico de treliça" na treliça de R. Não é se for para esse propósito, mas parece que sim.
r
data-visualization
Tyler 傲 来 国 主
fonte
fonte
Respostas:
Se as três primeiras são apenas coordenadas espaciais e os dados são escassos, você pode simplesmente fazer um gráfico de dispersão 3D com pontos de tamanhos ou cores diferentes para o valor.
Parece algo assim: (fonte: gatech.edu )
Se seus dados pretendem ser contínuos por natureza e existirem em uma grade de treliça, é possível plotar vários isocontours dos dados usando Cubos de Marcha .
Outra abordagem quando você tem dados 4D densos é exibir várias "fatias" 2D dos dados incorporados em 3D. Vai parecer algo assim:
fonte
Você tem quatro variáveis quantitativas? Nesse caso, experimente passeios, gráficos de coordenadas paralelas, matrizes de gráficos de dispersão. O pacote tourr (e tourrGui) no R executará tours, basicamente rotação em altas dimensões, você pode optar por projetar em 1D, 2D ou mais, e há um documento JSS que você pode ler para começar a ser mencionado no pacote. Gráficos de coordenadas paralelas e matrizes de dispersão estão no pacote GGally, e também matrizes de dispersão estão no pacote YaleToolkit. Você também pode consultar o http://www.ggobi.org para vídeos e mais documentação sobre tudo isso.
Se seus dados são totalmente categóricos, você deve usar gráficos ou variantes de mosaico. Dê uma olhada no pacote productplots em R, também vcd tem algumas funções razoáveis, ou o pacote ggparallel para fazer o equivalente a gráficos de coordenadas paralelas para dados categóricos. Além disso, acabamos de descobrir que o pacote extracat possui algumas funções para exibir dados categóricos.
Eu interpretei mal a pergunta, originalmente, porque parei com a pergunta e deixei de ler a descrição completa. Semelhante à abordagem abaixo (pontos de coloração em 3D), você pode usar a escovação vinculada para explorar as funções definidas em espaços de alta dimensão. Dê uma olhada no vídeo aqui, que mostra isso para uma função normal multivariada em 3D. O pincel pinta pontos com alta densidade (altos valores de função) e depois se move para valores mais baixos e mais baixos de densidade (baixos valores de função). Os locais onde a função é amostrada são mostrados em um gráfico de dispersão rotativo 3D, usando o tour, que também pode ser usado para examinar domínios dimensionais 4, 5 ou superiores.
fonte
Experimente os rostos de Chernoff . A idéia é anexar as variáveis às características faciais. Por exemplo, o tamanho do sorriso seria uma variável, a redondeza do rosto é outra etc. Por mais ridículo que pareça, isso pode realmente funcionar se você descobrir uma maneira inteligente de mapear variáveis para recursos.
Outra maneira é mostrar projeções em 2-d do diagrama de fases em 3-d. Digamos que você tenha x1, x2, x3, x4 suas variáveis. Para cada valor de x4, desenhe um gráfico tridimensional de (x1, x2, x3) pontos e conecte os pontos. Isso funciona melhor quando x4 é pedido, por exemplo, é data ou hora.
ATUALIZAÇÃO: você também pode tentar gráficos de bolhas. Três dimensões seriam cartesianas x, y, z e a quarta dimensão seria o tamanho do ponto de bolha.
Você pode tentar a animação, ou seja, use o tempo como quarta dimensão.
Também uma combinação de bolha e animação: x, y, bolha e tempo.
Além disso, relacionado a Chernoff está o gráfico de glifos , que pode parecer um pouco mais sério. São estrelas com comprimento de raios proporcional a valores variáveis.
fonte