Sou muito novo com R e estatísticas em geral, mas preciso fazer um gráfico de dispersão que acho que pode estar além das capacidades nativas.
Eu tenho alguns vetores de observações e quero fazer um gráfico de dispersão com eles, e cada par se enquadra em uma de três categorias. Eu gostaria de fazer um gráfico de dispersão que separa cada categoria, por cor ou por símbolo. Eu acho que isso seria melhor do que gerar três gráficos de dispersão diferentes.
Eu tenho outro problema com o fato de que em cada uma das categorias há grandes agrupamentos em um ponto, mas os agrupamentos são maiores em um grupo do que nos outros dois.
Alguém sabe uma boa maneira de fazer isso? Pacotes que devo instalar e aprender a usar? Alguém fez algo semelhante?
obrigado
Esse é um dos problemas clássicos do conjunto de dados 'Iris'. Este é um link para todo um conjunto de projetos de plotagem com base nesse conjunto de dados com código R, que você pode adaptar ao seu problema.
Aqui está uma abordagem que usa com a base R, em vez de um pacote complementar.
que produz esta figura:
A partir daí, dependendo do seu gráfico, você pode começar a mexer nos níveis de alfa / transparência para permitir a plotagem, etc.
Embora existam muitas razões para se manter na base R, outros pacotes simplificam a plotagem. A separação dos dados por um recurso distintivo é um dos pontos fortes dos pacotes ggplot2 e retículo . O ggplot2 cria gráficos visualmente atraentes. Ambos os pacotes são demonstrados na resposta por @cbeleites.
fonte
Ou com ggplot2:
O que produz
fonte