Não é irracional no início plotar os gráficos de linhas como uma série de múltiplos pequenos, com escalas diferentes para o eixo Y, mas com o eixo X (datas) alinhado.
Acho que este é um bom começo, pois permite examinar os dados brutos e comparar as tendências entre os diferentes gráficos de linhas. Na IMO, você deve examinar primeiro os dados brutos e depois pensar em conversões ou maneiras de normalizar os gráficos para serem comparáveis depois de examinar os dados brutos.
Como King já mencionou, parece que suas variáveis têm uma ordem natural com base nos nomes e números e, assumindo que seja apropriado, criei três novas variáveis com base na porcentagem convertida em cada estado. As novas variáveis são;
% Carts Created = Carts_Created/Visits
% Orders Created = Orders_Created/Carts_Created
% Carts Converted = Carts_Converted/Orders_Created
Fazer porcentagens é uma maneira de aproximar a série de uma escala comum, mas mesmo assim, colocar todas as linhas em um gráfico (como abaixo) ainda é difícil de visualizar com eficácia. O nível e a variação das ordens criadas e carrinhos da série convertida superam a das outras séries. Você não pode ver nenhuma variação nas séries criadas para carrinhos nessa escala (e suspeito que seja o que mais lhe interessa).
Então, novamente, a IMO, uma maneira melhor de examinar isso, é usar escalas diferentes. Abaixo está o gráfico de porcentagem usando escalas diferentes.
Com esses gráficos, não me parece haver nenhuma correlação significativa entre as séries, mas você tem muitas variações interessantes dentro de cada série (especialmente a proporção convertida). O que há com isso 2011-11-13
? Você tinha uma proporção muito menor de pedidos criados, mas todos os pedidos criados eram um carrinho convertido. Você teve outras intervenções que pudessem explicar tendências nas visitas ao local ou na proporção ou na porcentagem de carrinhos criados?
Tudo isso é apenas análise exploratória de dados e, para dar mais passos, eu precisaria de mais informações sobre os dados (espero que este seja um bom começo). Você poderia normalizar os gráficos de linhas de outras maneiras para poder plotá-los em uma escala comparável, mas essa é uma tarefa difícil, e acho que pode ser feita com a escolha eficaz de escalas arbitrárias com base no que é informativo, considerando os dados em vez de escolher alguns esquemas de normalização padrão. Outra aplicação interessante de visualizar muitos gráficos de linhas simultaneamente é o horizonte , mas é mais para visualizar vários gráficos de linhas ao mesmo tempo.
Você pode ter 2 eixos y separados, Visitas (k) e Carrinhos criados em um, os outros 2 em outro (ou da maneira que melhor se adequar ao seu objetivo).
Definitivamente, esse não é um método elegante, mas lembro-me de fazê-lo anos atrás, quando eu só queria comparar tendências ao longo do tempo.
OU
Você pode plotar a alteração percentual ao longo do tempo, se ela se adequar ao seu objetivo.
fonte
No final, decidi normalizar os dados dividindo cada valor pelo valor máximo e depois multiplicando por 100.
Encontre o valor máximo:
Divida cada número pelo máximo e multiplique por 100:
Em seguida, plotei isso no gráfico, obviamente isso só demonstra tendência e o usuário tem a tabela de dados na parte inferior da página.
fonte
Essa seria minha abordagem também - - para ajustar as diferentes dimensões para a mesma escala, dividindo por X, mas eu usaria o valor médio, e não o valor máximo ou mínimo. O motivo é que, à medida que você adiciona dados ao longo do tempo, é provável que seu máximo ou mínimo seja alterado e, em seguida, o que era 100% no último gráfico é outra coisa dessa vez - o gráfico não é tão facilmente reconciliável com os gráficos anteriores - - se Se você usar o avg, as alterações não serão tão drásticas.
fonte