Então, eu estava procurando por um dos meus próprios sites no Google: http://www.botlibre.com
e, para minha surpresa, encontrei alguns clones do meu site, como:
http://83waystowasteyourtime.adidas.com
e:
http:// mediaiq.astral.comm
Minha pergunta é:
- Por que eles estão criando clones do meu site? Algum tipo de esquema de SEO ou o quê? Que ganho eles poderiam estar obtendo?
- Como eles têm um URL em
adidas.com
eastral.comm
? Suponho que a Adidas não esteja reforçando meu conteúdo. - Como faço para desligar esses sites e impedir que as pessoas roubem meu conteúdo? (no Tomcat)
google-index
legal
serps
James
fonte
fonte
Respostas:
OK. É um tanto estranho, mas não tão trágico quanto você imagina.
Não tenho certeza de qual seria o resultado. Isso não faz absolutamente sentido para mim, por que alguém faria isso. Não vejo nenhuma vantagem para o hacker. A boa notícia é que o visitante está acessando seu site. No entanto, haverá um impacto do ponto de vista de SEO, então você deseja corrigir isso rapidamente.
Seu site, presumo, não está em um servidor compartilhado, portanto, se você acessar o site pelo endereço IP, ele ainda funcionará. Eu testei isso e faz.
83waystowasteyourtime.adidas.com e mediaiq.astral.com são subdomínios usando um hack antigo que permite a qualquer pessoa criar um subdomínio para qualquer domínio desavisado. Você pode ler sobre isso aqui: http://www.techrepublic.com/blog/it-security/watch-out-for-dns-sub-domain-hijacking/ Existem mais sites se o subdomínio do Google DNS DNS hackear .
A boa notícia é essa. Estes não são clones ou cópias do seu site, eles são o seu site. Cada subdomínio aponta especificamente para o seu endereço IP.
Você pode fazer um:
e
em qualquer computador linux para ver.
Você provavelmente pode combater isso, embora não tenha certeza de qual método funcionará:
Supondo que você tenha o Apache instalado, você pode editar o arquivo .htaccess no diretório raiz da web e inserir o código a seguir.
Adicione o seguinte na parte superior do arquivo para ativar o mecanismo de reescrita.
Bloqueio por host:
--ou--
Bloqueio por referenciador:
Você vai querer testá-las e nos dizer qual delas funciona. Por favor. Pode ser que precisemos procurar outro método.
É claro que você pode alterar a regra de reescrita e redirecioná-la diretamente para o seu site, com:
--ou--
Envie-os para o inferno (humor) com:
... que é um site real. Mas você passaria o problema para eles.
Eu recomendo bloqueá-los.
Como @Martijn mencionou em seu comentário e vale a pena preservar, você pode ter links canônicos por página para ajudar a protegê-lo. Nesse caso, o link apontaria para a página em que o link está. É mais trabalho, mas parece uma boa ideia nos dias de hoje.
Além disso, você pode alcançar os proprietários do domínio pai e deixá-los se juntar a você na batalha:
Adidas.com
Astral.com
fonte