Evitar a fraude de cliques no sistema de propaganda com PHP e Javascript

10

Gostaria de criar um projeto de publicidade com PHP, MySQL e Javascript. Estou falando de algo como ...

  • Anúncios do Google
  • BuySellAds.com
  • Qualquer outra plataforma de publicidade

Minha pergunta é principalmente: o que preciso procurar para evitar que as pessoas trapaceiem o sistema e quaisquer outros problemas que eu possa encontrar?

Meu conceito de design. Um anúncio é um registro no banco de dados; quando uma página é carregada, usando Javascript, ele chama meu servidor, que por sua vez usa um script PHP para consultar o banco de dados e obter um anúncio aleatório. (Pode ser muito bom obter um anúncio com base na demografia ou em outros critérios). O script PHP retornará o anúncio ao servidor / site que o está chamando e o exibirá na página como uma imagem que terá um rastreamento especial ligação.

Vou precisar ...

  • Contar todas as impressões (quando o anúncio é exibido na página)
  • Conte todos os cliques no link Anúncio
  • Contar todos os cliques exclusivos no link Anúncio

Minha pergunta é puramente sobre a consulta e exibição do anúncio e nada a ver com o lado da administração. Se houver algum dinheiro envolvido com minha compra / venda de espaço de anúncio, as estatísticas deverão ser precisas e garantir que as pessoas não possam enganar facilmente o sistema. O rastreamento do endereço IP é realmente a única maneira de tentar evitar a fraude de cliques?

Espero que alguém com alguma experiência possa esclarecer que estou no caminho certo? Além de me dar algum conselho, dicas ou qualquer outra coisa que eu deva saber sobre como fazer algo assim?


fonte
2
não reinvente a roda. openx.com
dynamic
3
@ yes123 este dificilmente é reinventar a roda, openx está inchado e mais um serviço com API e taxas de excesso etc, eu estou olhando para código de algo auto-contido e leve
"O rastreamento do endereço IP é realmente a única maneira de tentar evitar a fraude de cliques?" sim, mas espero que alguém me prove que estou errado.
Joshua Drake
2
É impossível impedir a fraude de cliques. Aqui está um exemplo dos comprimentos que os fraudadores irá para: behind-the-enemy-lines.com/2011/03/... - Aviso algumas das imagens mais abaixo na rede são NSFW
JamesG
11
Aviso: O link de JamesG é muito NSFW.
Aric TenEyck

Respostas:

4

Ninguém paga por "anúncios aleatórios" desde 1998.

Exibir anúncios aleatórios é um esforço inútil. Quão valiosas são as propagandas de produtos femininos em sites voltados para homens ou vice-versa. Eu diria que eles têm um valor negativo para mim como anunciante. A entrega de anúncios mais sofisticada implica um conjunto muito mais sofisticado de metadados sobre o visualizador, que é anônimo para todos os fins, a menos que você seja o Google em 2012.

PHP e RDMBS para sistemas como este não escalam.

Veja o que a Mochigames fez pela solução de servidor de distribuição de anúncios personalizada interna. dica: não é baseado em PHP ou banco de dados tradicional.

Os endereços IP não servem para nada além do para o qual foram projetados.

O rastreamento de endereços IP é a maneira absolutamente errada de abordar esse problema. Os endereços IP são para rotear para sua localização , nada mais. Eles não são um ID globalmente exclusivo e, portanto , são menos que inúteis.

  • Os endereços IP não são únicos por causa do NAT.

  • Os endereços IP não são únicos devido à falsificação.

  • Os endereços IP não são exclusivos devido a proxies aleatórios anônimos.

  • Os endereços IP são inúteis na detecção de redes de bots, o mecanismo mais comum de fraude de cliques.

  • Os endereços IP também são inúteis na detecção de redes humanas.

Bolsos profundos

O Google e os outros grandes players gastam 10 milhões de dólares com esse problema todos os anos, talvez mais. Eles não podem parar com todo esse dinheiro e Phd.s no bolso, duvido que algum PHP e Javascript do lado do cliente (que por definição é inútil) tenham algum impacto.

A única maneira de detectar e marginalizar a fraude de cliques é aplicar algoritmos muito sofisticados de aprendizado de máquina (é aqui que o Phd entra em ação) depois do fato de procurar padrões muito amplos de comportamento (é aí que o dinheiro entra em ação) e ter esse algoritmo se adapta ao longo do tempo para se tornar mais preciso.

A aceitação de alguma fraude de clique é inevitável

Mas, mesmo assim, é necessário ajustar os resultados em favor de falso negativo, ou seja, você deve estar disposto a aceitar alguma fraude de clique real, porque não pagar por falsos positivos minaria completamente sua dignidade de confiança para seus clientes legítimos.


fonte
Para esclarecer seu primeiro parágrafo, os meus anúncios seria de anúncios de desenvolvedor web e apenas mostrado em sites de desenvolvedores web, de modo que seria relevent
JasonDavis