Analytics: CloudFlare vs Google - Que discrepância é grande demais?

10

Faz uso de CloudFlare em um de nossos sites há cerca de uma semana e o CloudFlare reporta 450% mais visualizações reais de páginas de visitantes que o Google Analytics (portanto, não são bots ou ameaças bloqueadas).

Entendo que haverá discrepância porque o CloudFlare está medindo todas as solicitações de página, o Google Analytics dispara uma solicitação de JavaScript depois que a página é baixada, então eu estava preparado para uma diferença de 20 a 30%, talvez 50%, mas 450%?

Parece que há um problema em algum lugar. Eu usei o depurador do Google Analytics para chrome e tudo parece funcionar bem. O código GA está na cabeça, portanto, deve ser acionado rapidamente.

Uma lacuna tão grande é normal? Se sim, por que, e se não, o que está causando isso?

Atualizada

Desculpe, não acho claro, entendi as diferenças entre as estatísticas de CF e GA antes de começar com CF e esperava que fossem diferentes. É o tamanho da diferença que é preocupante.

O CF separa claramente bots e rastreadores de visitantes regulares; portanto, o número que estou comparando com o GA é apenas o visitante regular; então a diferença diz que apenas 1 em cada 5 visitantes aciona o Google Analytics ?

"your CloudFlare visitor number is most likely higher"

Não faz justiça!

CodeMonkey
fonte
Eu tenho o mesmo problema com uma discrepância ainda maior. Eu acho que o número de visitantes pode ser a razão. Quantas visualizações de página o seu GA informa por um mês? Para mim, o número de visualizações de página relatadas pela CF por um período específico é 223.000.000 enquanto o número relatado pela GA é 22.000.000. Definitivamente, isso não pode ser devido a robôs ou .js. Acho que isso se deve ao limite de dados do GA, conforme relatado por si só, eles não garantem a entrega de dados corretos por mais de 10 milhões de visualizações de página por mês. Enfim, é isso que penso e ainda não tenho certeza.
Manoochehr 6/11/14
Outra coisa: se uma de sua imagem estiver com hotlink, ela provavelmente aciona uma visita ao Cloudflare, embora não deva. Isso é complicado. Eu diria que visitas sólidas provavelmente serão registradas pelo Google Analytics do que pelo Cloudflare.
precisa saber é o seguinte

Respostas:

4

O CloudFlare reconhece isso e fornece a seguinte explicação :

CloudFlare Analytics vs. Outros serviços

O Google Analytics e outros programas de análise baseados na Web acompanham os visitantes que acionam o JavaScript. Como resultado, ameaças, bots e rastreadores automatizados não são registrados, pois esses visitantes normalmente não acionam JavaScript. Esses serviços também não rastreiam visitantes que saem de uma página antes que ela seja totalmente carregada ou com o Javascript desativado. O CloudFlare rastreia todo o seu tráfego por solicitações, portanto o número de visitantes do CloudFlare provavelmente é maior.

Lembre-se: o CloudFlare pode rastrear apenas visitantes que passam pelo sistema CloudFlare, representado por uma nuvem laranja na sua página de configurações de DNS.

Eles alegam que suas próprias análises "geralmente são mais precisas do que outros serviços que dependem do JavaScript".

Andrew Lott
fonte
obrigado pelo seu tempo, mas eu entendo o raciocínio, é que minha mente está impressionada com a escala da diferença! Eu tinha atualizado a minha pergunta com um pouco mais detalhadamente
codemonkey
4

Observei diferenças semelhantes ao comparar os logs do Apache com as análises e vi uma proporção (de um dia) de 1000: 1. É remotamente possível que você tenha alguma base de usuários que bloqueie o Google Analytics com produtos como NoScript e Ghostery, ou que não execute nenhum javascript. Descobri que o Piwik fornece relatórios melhores e pode ser configurado para que os bloqueadores de rastreadores não bloqueiem seu script e os usuários sem javascript ainda possam ser rastreados por meio de um esquema de rastreamento de imagem de 1 x 1 pixel. No entanto, não tenho experiência real com o CloudFlare ou CDNs em geral, portanto não sei se isso afeta os relatórios do Piwik.

Paulo
fonte
80% de bloqueio do GA parece muito alto para mim, isso soa normal para você? Por curiosidade, o que você usou para analisar logs do apache e filtrar bots e ameaças?
precisa saber é o seguinte
Eu acho que a porcentagem típica de usuários que bloqueiam ativamente os plug-ins seria inferior a 5%, mas não tenho base real para isso, além de observar os hábitos de navegação de amigos, colegas de trabalho etc. Para os logs do Apache, eu apenas uso o AWStats - não ' Não filtre nada, pelo menos não como eu o configurei. Mudei para o Piwik porque um dos meus sites não executa nenhum script e, para outros sites, gosto mais dos relatórios.
Paul
2

não é tão difícil entender por que os números do Cloudflare são muito mais altos do que o seu GA. a razão é que o Cloudflare é um intermediário. deixe-me explicar em detalhes.

Você vê que quando alguém acessa um site que usa o Cloudflare, os usuários enviam uma solicitação ao Cloudflare, informando todas as informações, como agente de usuário IP e outras. portanto, nem importa se o usuário que usa extensões como bloqueador de scripts ou outros Cloudflare saberá que alguém visitou seu site.

por que os números são altos? Você vê sempre que um site é registrado ou domínio, para ser preciso, o grande homem como o Google envia seus robôs para coletar informações. lembre-se não apenas o Google envia seus bots, mas há muitos outros. existem muitas maneiras de o Cloudflare saber que é um bot ou uma pessoa real, mas não tenho certeza se eles separam ou removem as visitas do bot.

Além disso, essas medidas para diferenciar podem ser facilmente enganadas.

conclusão: sempre que seu site é solicitado, ele adiciona +1 ao número total.

pensamentos adicionais: não tenho muita certeza, mas se você adicionar um arquivo .js ou .png ou qualquer outro arquivo no seu site. seu navegador faz uma solicitação para o link fornecido, que também pode contar como uma visita ao site. por exemplo: se em uma página há 10 fotos e para carregar todas, o navegador solicita todas as fotos individualmente, o que pode levar o número de visitas de 1 a 11. (10 para fotos e uma para HTML do site)

user97589
fonte
1

Nunca vi meu Cloudflare Analytics até agora, mas os seus estão mais próximos do Analytics do que os meus. O Cloudflare reporta 20 vezes o número de visitas únicas em comparação com o Google e é aproximadamente o mesmo para visualizações de página.

nathangiesbrecht
fonte
Interessante, então é algo que você provavelmente investigará mais?
código é o seguinte
Examinei um pouco os logs e parece que a maioria dos bots está causando a discrepância. Isso e eu tenho um verificador de "tempo de atividade" executado no Google Docs, que acessa o site a cada 5 minutos.
Nathiesbrecht #
1

Recentemente, destruí um site baseado no WP do cliente e acendi um site totalmente novo. Ao mesmo tempo, adicionei o CF ao seu novo site. Seu site antigo continuava atingindo os limites do servidor bc de ladrões. Quando criei o novo site, eu os frustrei, destruindo todos os URLs de imagem antigos. Agora o CF relata uma quantidade de tráfego muito maior do que o GA e acredito que seus bc de solicitações ao servidor que agora são imagem 404 não foram encontradas por todos os ladrões que hotlinking suas imagens antigas. Apenas meus dois centavos.

Christopher Scott
fonte