Existe um site de má reputação, conhecido como trinta, que espelhou completamente meu site e agora possui links que aparecem no Google no primeiro lugar usando meu conteúdo. Eu verifiquei meus arquivos de log e notei que este site está rastreando o meu há algum tempo e também possui 10.000 links do site para o meu.
Eu bloqueei o acesso do usuário referido neste site e os relatei como spam da Web para o Google. Eu também rejeitei o domínio.
Como eles estão conseguindo os melhores links no Google (mesmo ultrapassando os meus) por essas táticas nefastas? Quais são as etapas para eliminar completamente um problema como esse?
ATUALIZAÇÃO 8/28/2014:
Eu pensei em fornecer uma atualização sobre isso, pois tenho mais informações agora. Então, trinta apontaram seus subdomínios para o meu ip, o que fez com que seus subdomínios se parecessem com o meu site.
Por alguns dias, isso não importou muito, porque usando o htaccess, redirecionei todos os HOSTS que não eram do meu domínio, de volta ao meu domínio, o que basicamente significava que eu estava recebendo os links de tráfego dos subdomínios no Google. Depois de alguns dias, trinta e poucos alteraram seus subdomínios para voltar ao site, para que eu não me beneficiasse mais com isso.
Portanto, o ponto principal é que eles usaram meu conteúdo para obter as melhores posições no Google e agora apontam esses links para o site deles para direcionar mais tráfego para o site deles.
É uma tática suja por um site sujo. Minha esperança é que o Google castigue esse comportamento.
fonte
Respostas:
Se eles estão apenas espelhando seu site, alimentando-o por meio de um script proxy ou regurgitando seu verbatum HTML, você pode adicionar URLs canônicos às suas páginas. Isso permitirá que o Google saiba que seu conteúdo é a fonte original e mostre seu URL nos resultados da pesquisa, não no deles.
Envie uma solicitação DMCA ao Google. Eles são um pouco lentos com eles, mas acabam removendo essas páginas do índice.
Negar os links é uma jogada inteligente.
Não sei se o bloqueio de usuários é útil. Talvez colocar uma mensagem no topo de suas páginas para que eles saibam que você é o site original e o outro é que uma fraude pode ser uma solução melhor.
fonte
Você pode registrar uma reclamação da DMCA e, se estiver nos EUA, pode entrar com uma ação civil de direitos autorais.
Aqui está um link para uma resposta curta que explica como a reclamação da DMCA pode ajudar alguém:
Você precisa estar nos Estados Unidos para registrar uma reclamação DMCA?
... e outro explica mais ...
Quanto do seu conteúdo precisa ser copiado antes que você possa registrar uma reclamação DMCA?
Se você estiver nos EUA, poderá contratar um advogado familiarizado com questões de direitos autorais e solicitar que ele envie uma carta de cessação e desistência. Dê a eles 10 dias (dias reais e não dias úteis, embora os dias úteis também sejam bons) para remover o conteúdo. Você deseja capturar instantâneos do site ofensivo para sua evidência e instantâneos do seu site também. Se você verificar se uma página foi removida, verifique o site diretamente e não procure os resultados.
Se a página não tiver sido removida dentro do período, você poderá registrar um processo civil federal que levará pelo menos US $ 10.000 para se defender e dificilmente custará nada. Você estará no banco do motorista. É provável que um acordo possa ser obtido por pelo menos US $ 10.000 e possivelmente mais. Você também pode recuperar seus custos. O importante é oferecer uma opção gratuita para corrigir o problema, portanto, a carta de cessar e desistir. Depois disso, você pode registrar um caso sem responsabilidade do réu.
Outra observação é que você precisará demonstrar danos se for a tribunal. Perda do tráfego de pesquisa é danos. Aqui, você trabalhará com seu advogado para coletar métricas que ilustram a perda de tráfego e precisará gerar receita com o valor desse tráfego. Claro que você pode assumir números mais altos aqui, mesmo com uma taxa de conversão de 100%. Por precaução, eu coletaria métricas sobre perda de tráfego usando o Google Analytics e seu software de análise de arquivos de log hoje e no futuro.
Saiba que registrar um caso não é difícil ou muito caro, especialmente se comparado aos danos que você está enfrentando agora e no futuro. As violações de direitos autorais têm diminuído ultimamente, mas as poucas que violam direitos autorais são muito mais ousadas atualmente. Precisamos parar essas pessoas e a única maneira real é colocar um fator de custo na estratégia de negócios que torna a violação de direitos autorais não lucrativa.
fonte
Você pode rastrear o IP (ou IPs) e retornar conteúdo totalmente diferente para que eles espelhem - o que você quiser. Dessa forma, você obtém espaço livre para anunciar qualquer coisa e pode usar a alta posição deles no Google a seu favor.
Uma vez eu usei isso para simplesmente explicar aos usuários no site espelhado que esse é o domínio errado. Você também pode postar um cabeçalho de redirecionamento HTTP simples.
fonte
Um pouco tarde para você, mas a melhor idéia para proteger seu site (no futuro) seria esta: https://www.youtube.com/watch?v=I3pNLB3Cq24 (defcon 21, defesa por números) falsificando o código de retorno para que os usuários verá o conteúdo, mas os robôs
outras idéias possíveis - verifique se seus usuários não veem nada disso:
outras idéias:
fonte
Isso é chamado de Google Proxy Hack, e aconteceu comigo também.
Primeiras coisas primeiro:
Fundamentalmente, porém, isso é um fracasso da parte do Google. Por tudo o que eles dizem sobre a classificação ser baseada em "conteúdo original de qualidade", esse é um contra-exemplo absurdamente simples que, francamente, é apenas embaraçoso.
Esperemos que, se um número suficiente de pessoas se queixar, o Google acabará se reunindo e escreverá as 10 linhas de código necessárias para verificar se um site é um espelho exato de um site previamente estabelecido.
Além disso, lembre-se de que o uso de URLs canônicos nem sempre funciona nessa instância. Muitos desses scripts de proxy alteram os URLs canônicos para apontar para o site espelho, tornando-os inúteis.
Por fim, esteja ciente de que eles também podem enviar spam para o seu site principal com links de lixo para danificar seus rankings. (Isso também me aconteceu.)
Se você fizer alguma pesquisa e pensamento criativo, existem algumas maneiras de revidar. Realmente não acho que seja uma boa ideia publicar uma lista completa aqui, porque isso facilita a vida dos hackers.
fonte
Como outros já mencionaram, registrar uma queixa da DMCA e uma ação civil de direitos autorais pode ser a melhor opção.
Para o novo conteúdo que você publica, considere notificar sobre as atualizações do seu site nas mídias sociais (Twitter, Facebook etc.) assim que publicar. O registro de data e hora registrado pode ser um indicador justo que você escreveu primeiro, caso precise provar. Por meio das Ferramentas do Google para webmasters, você pode aplicar uma configuração para que o Googlebot rastreie seu site com frequência . Supondo que os mecanismos de pesquisa populares indexem suas páginas da Web regularmente (use o operador do site, site: exemplo.com, para descobrir) a data na cópia em cache pode ser usada como um indicador aproximado de quando o conteúdo foi publicado.
Também para o novo conteúdo que você publica, é possível incorporar marcas d'água em imagens e colocar comentários em arquivos JS, indicando que você é o proprietário original desses arquivos.
fonte