Quais são algumas opções populares para visualizar dados em 4 dimensões?

12

Digamos que eu possua os seguintes dados quadridimensionais, nos quais os três primeiros podem ser considerados como coordenadas e o último pode ser considerado como valores.

c1, c2, c3, value
1, 2, 6, 0.456
34, 34, 12 0.27
12, 1, 66 0.95

Como visualizar melhor o efeito das três primeiras coordenadas no último valor?

Estou ciente de três métodos.

Uma é a plotagem 3D para as três primeiras coordenadas com o tamanho de pontos como o valor quatro. Mas não é tão fácil ver a tendência nos dados.

Outro está usando uma série de plotagem 3D, cada uma com uma coordenada fixa. insira a descrição da imagem aqui

Outro pode ser um chamado "gráfico de treliça" na treliça de R. Não é se for para esse propósito, mas parece que sim. insira a descrição da imagem aqui

Tyler 傲 来 国 主
fonte
2
Você precisa de uma exibição estática (por exemplo, para um papel)?
gung - Restabelece Monica

Respostas:

12

Se as três primeiras são apenas coordenadas espaciais e os dados são escassos, você pode simplesmente fazer um gráfico de dispersão 3D com pontos de tamanhos ou cores diferentes para o valor.

Parece algo assim: (fonte: gatech.edu )Dispersão

Se seus dados pretendem ser contínuos por natureza e existirem em uma grade de treliça, é possível plotar vários isocontours dos dados usando Cubos de Marcha .

Outra abordagem quando você tem dados 4D densos é exibir várias "fatias" 2D dos dados incorporados em 3D. Vai parecer algo assim:

Fatias

mklingen
fonte
O gráfico de dispersão 3D colorido é realmente adequado apenas para funções contínuas em dados 3D. Se o gradiente da função mudar suavemente, você poderá ver algum padrão na dispersão de pontos. Da mesma forma, a visualização do volume na parte inferior também funciona melhor nesse cenário. Se a função for muito barulhenta, será difícil ver alguma coisa. Se você tiver 4 variáveis ​​explicativas (como para fazer PCA ou agrupamento), plotar 3 nas coordenadas euclidianas e a quarta usando algum mapeamento não linear para colorir, introduzindo algum viés perceptivo, que não pode ser quantificado.
Dianne Cozinhe
@DianneCook isso é verdade. Eu acho que é o que eu recebo por sempre trabalhar com alisar, dados 3D volumétricos contínuas;)
mklingen
Ei, isso é o que o quesiton pediu% ^)
Dianne Cozinhe
9

Você tem quatro variáveis ​​quantitativas? Nesse caso, experimente passeios, gráficos de coordenadas paralelas, matrizes de gráficos de dispersão. O pacote tourr (e tourrGui) no R executará tours, basicamente rotação em altas dimensões, você pode optar por projetar em 1D, 2D ou mais, e há um documento JSS que você pode ler para começar a ser mencionado no pacote. Gráficos de coordenadas paralelas e matrizes de dispersão estão no pacote GGally, e também matrizes de dispersão estão no pacote YaleToolkit. Você também pode consultar o http://www.ggobi.org para vídeos e mais documentação sobre tudo isso.

Se seus dados são totalmente categóricos, você deve usar gráficos ou variantes de mosaico. Dê uma olhada no pacote productplots em R, também vcd tem algumas funções razoáveis, ou o pacote ggparallel para fazer o equivalente a gráficos de coordenadas paralelas para dados categóricos. Além disso, acabamos de descobrir que o pacote extracat possui algumas funções para exibir dados categóricos.

Eu interpretei mal a pergunta, originalmente, porque parei com a pergunta e deixei de ler a descrição completa. Semelhante à abordagem abaixo (pontos de coloração em 3D), você pode usar a escovação vinculada para explorar as funções definidas em espaços de alta dimensão. Dê uma olhada no vídeo aqui, que mostra isso para uma função normal multivariada em 3D. O pincel pinta pontos com alta densidade (altos valores de função) e depois se move para valores mais baixos e mais baixos de densidade (baixos valores de função). Os locais onde a função é amostrada são mostrados em um gráfico de dispersão rotativo 3D, usando o tour, que também pode ser usado para examinar domínios dimensionais 4, 5 ou superiores.

Dianne Cook
fonte
2

Experimente os rostos de Chernoff . A idéia é anexar as variáveis ​​às características faciais. Por exemplo, o tamanho do sorriso seria uma variável, a redondeza do rosto é outra etc. Por mais ridículo que pareça, isso pode realmente funcionar se você descobrir uma maneira inteligente de mapear variáveis ​​para recursos.

Outra maneira é mostrar projeções em 2-d do diagrama de fases em 3-d. Digamos que você tenha x1, x2, x3, x4 suas variáveis. Para cada valor de x4, desenhe um gráfico tridimensional de (x1, x2, x3) pontos e conecte os pontos. Isso funciona melhor quando x4 é pedido, por exemplo, é data ou hora.

ATUALIZAÇÃO: você também pode tentar gráficos de bolhas. Três dimensões seriam cartesianas x, y, z e a quarta dimensão seria o tamanho do ponto de bolha.

Você pode tentar a animação, ou seja, use o tempo como quarta dimensão.

Também uma combinação de bolha e animação: x, y, bolha e tempo.

Além disso, relacionado a Chernoff está o gráfico de glifos , que pode parecer um pouco mais sério. São estrelas com comprimento de raios proporcional a valores variáveis.

Aksakal
fonte
Obrigado pela resposta. Parece que a segunda opção é possível ao meu problema. Eu acho que o primeiro não parece tão sério para um trabalho de pesquisa. Basicamente, eu gostaria que o enredo pudesse revelar alguma tendência ou influência de três fatores no valor (quarta dimensão).
Tyler傲来国主
5
Os rostos de Chernoff foram usados ​​em pesquisas sérias.
Aksakal
1
As faces de Chernoff podem ser extraordinariamente úteis, especialmente quando a dimensionalidade está em torno de 10 a 20 variáveis. Para quatro dimensões, eles não são tão eficazes quanto outros tipos de representações gráficas.
whuber
3
Os rostos de Chernoff são uma péssima idéia! se você precisar usar uma plotagem de ícone, use uma plotagem em estrela. Se você tiver um conjunto de dados muito pequeno, isso pode ser útil, mas tente plotar 1000 ícones e veja se você realmente consegue ver alguma coisa!
Dianne Cook