O guia para webmasters de conteúdo duplicado do Google define conteúdo duplicado (para fins de otimização de mecanismos de pesquisa) como "blocos substantivos de conteúdo dentro ou entre domínios que correspondem completamente a outro conteúdo ou são consideravelmente semelhantes".
O guia do Google continua a lista dos seguintes exemplos de conteúdo duplicado:
- Fóruns de discussão que podem gerar páginas regulares e reduzidas direcionadas para dispositivos móveis
- Armazene itens mostrados ou vinculados por meio de vários URLs distintos
- Versões somente de impressora de páginas da web
Sanções
Os mecanismos de pesquisa precisam penalizar algumas instâncias de conteúdo duplicado, projetadas para enviar spam ao índice de pesquisa, como:
- sites raspadores que copiam conteúdo por atacado
- técnicas simplistas de fiação de artigos que geram conteúdo "novo" substituindo seletivamente as palavras no conteúdo existente.
Quando os mecanismos de pesquisa encontram conteúdo duplicado, eles podem:
- Penalize um site inteiro que contenha conteúdo duplicado. (quando spam)
- Escolha uma página como a fonte canônica do conteúdo e diminua a prioridade ou não indexe a outra página com a duplicação. (comum)
- Não tome nenhuma ação punitiva e indexe várias cópias do conteúdo (raro)
Evitando duplicação interna
Quando perguntado sobre o conteúdo duplicado, Matt Cutts , do Google, disse que isso só deve prejudicá-lo se parecer spam , no entanto, muitos webmasters empregam as seguintes técnicas para evitar a duplicação desnecessária de conteúdo:
- Verifique se o conteúdo está acessível apenas em um URL canônico
- Se o seu site precisar retornar o mesmo conteúdo em vários URLs (por exemplo, para uma página "visualização de impressão"), especifique um URL canônico manualmente com um elemento de link no cabeçalho do documento
- Nos casos em que seu site retornar conteúdo semelhante com base nos parâmetros codificados no URL (por exemplo, classificando um catálogo de produtos), exclua os parâmetros de URL nas Ferramentas do Google para webmasters
Organização de Conteúdo
A publicação de conteúdo em seu site que foi publicado em outro lugar é chamado de organização de conteúdo. Criar conteúdo duplicado por meio da organização de conteúdo pode ser bom:
- Contanto que você tenha permissão para fazê-lo
- Você diz a seus usuários qual é o conteúdo e de onde ele veio
- Você vincula a uma fonte original (um link direto direto para o conteúdo original da página com a cópia, não apenas um link para a página inicial do site onde o original pode ser encontrado)
- Seus usuários acham útil
- Você tem algo a acrescentar a esse conteúdo, de forma que os usuários prefiram encontrá-lo em seu site do que em outros lugares. (Comentário ou crítica, por exemplo.)
- Você também tem conteúdo original suficiente no site (pelo menos 50% do original, mas idealmente 80% do original)
Embora o Google não penalize todas as instâncias de conteúdo duplicado, mesmo o conteúdo duplicado não penalizado pode não ajudar você a receber visitantes:
- Você está competindo com todas as outras cópias existentes
- O Google provavelmente preferirá a fonte original do conteúdo e a cópia mais respeitável do conteúdo.
O Google penalizará o conteúdo duplicado publicado em seu site de outras fontes se:
- Parece ser raspado ou roubado (especialmente sem atribuição).
- Os usuários não reagem bem a isso (principalmente clicando no Google depois de visitar seu site.)
- Existem tantas cópias por aí que não há razão para enviar usuários à sua cópia.
- Sua cópia não é o original, mais respeitável ou mais utilizável; e não tem nenhum comentário ou crítica.
- Seu site não possui conteúdo original suficiente para equilibrar todo o conteúdo republicado.
- Você duplica as páginas com tanta frequência em seu próprio site que o Googlebot tem problemas para rastrear o site completo.
Internacionalização e segmentação geográfica
A localização de conteúdo é uma área em que a duplicação de conteúdo pode ser benéfica para o SEO. É perfeitamente bom publicar o mesmo conteúdo em sites direcionados a diferentes países que falam o mesmo idioma. Por exemplo, você pode ter um site nos EUA, um site no Reino Unido e um site na Austrália, todos com o mesmo conteúdo.
Com um site para cada país, geralmente é possível ter uma classificação melhor para os usuários daquele país. Além disso, é possível atender especificamente aos usuários em cada país com pequenas diferenças ortográficas, preços na moeda do país ou opções de envio do produto. Para obter mais informações sobre a configuração de sites com segmentação geográfica, consulte Como estruturar meus URLs para SEO e localização?
Lidando com Raspadores de Conteúdo
Outros sites que roubam seu conteúdo e o republicam sem permissão podem ocasionalmente causar problemas de conteúdo duplicado no seu site. Os mecanismos de pesquisa trabalham duro para garantir que seja difícil para os sites de raspadores se beneficiarem da duplicação do seu conteúdo . Se um site raspador estiver causando problemas para você, talvez seja possível remover o site do índice do Google registrando uma solicitação DMCA no Google