Como lidar com conteúdo duplicado / URLs no Joomla?

11

Acabei de descobrir um grande problema de SEO e, enquanto eu o resolvi por enquanto; Eu estou tentando descobrir por que isso pode ter ocorrido em primeiro lugar e se houve algum erro ou se tem algo a ver com o próprio Joomla. Primeiro a questão:

Quando rastreei um site com a Moz, ele mostrou quatro conteúdos duplicados para a página inicial, o que era inesperado. Por exemplo, para a página inicial http://www.foo.com, ele mostrava URLs de conteúdo duplicados, como os seguintes:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

E todos esses links estavam simplesmente carregando o conteúdo da página inicial, mas os meta-detalhes eram do artigo. Obviamente, isso indicava que o Joomla estava criando automaticamente os links e eu achei o mesmo para os 4 links. O link no artigo era assim:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Os Itemid = 1corresponde ao item de menu página que explica por que a página inicial foi de carregamento. Tentei recriar o problema, mas não consegui. De acordo com as pessoas que adicionaram o conteúdo, eis as etapas que eles fizeram ao criar esses artigos e links dentro dele:

  1. Criar artigos
  2. Adicione o link a outros artigos usando a guia 'Artigo' no editor de conteúdo.
  3. Criar item de menu para os artigos

Então, eu queria saber se há algo obviamente errado aqui. Estou confuso porque existem mais de 100 artigos, mas isso aconteceu apenas em cerca de 5 artigos. Obrigado.

sifu
fonte

Respostas:

15

Índice desta resposta:

  1. Conteúdo com o mesmo ID do item
  2. Como o conteúdo duplicado é criado / Páginas dinâmicas / URLs
  3. Perspectiva de SEO
  4. Lidando com conteúdo duplicado no Joomla
  5. Referências e links

1. Por que os artigos estão sendo exibidos sob o mesmo item

Primeiro de tudo, esse não é o problema porque você está recebendo URLs duplicados. Os artigos estão usando o ID do item da página inicial, porque não há outro ID de item atribuído a eles.

Leia mais sobre isso:

E este também pode ser interessante:



2. Como é criado o "conteúdo duplicado" / Páginas dinâmicas / URLs

Na verdade, esse é um comportamento padrão para sites dinâmicos que geram suas páginas usando parâmetros de URL para construir cadeias de consulta na forma de pares de valor de campo . O servidor / aplicativo receberá a consulta, processará e retornará o conteúdo associativo ao navegador.

Para entender melhor isso, convém desativar os URLs SEF em um site Joomla e estudar um pouco o URL não SEF de uma página:

Exemplo:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Dividindo a consulta acima em pares campos-valor, vemos:

  • opção = com_content
  • view = artigo
  • id = 3
  • catid = 9
  • Itemid = 101

Estes são os valores dos campos que o Joomla entende e tentará retornar o seguinte conteúdo como:

Ele fará uma consulta no componente com_content e usará uma exibição de artigo para exibir o item de conteúdo (artigo) com o ID 3, do ID da categoria 9, usando o Item de Menu com o ID 101.


Muitas variações de URL para 1 página

No entanto, o mesmo artigo pode ser exibido com ainda mais combinação de campos e valores:

Algumas combinações possíveis podem ser:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = pt-br
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = pt

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = pt-BR & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = pt-BR & tmpl = component

Como você pode ver, todas as opções acima estão solicitando os mesmos dados do sistema, que é o artigo com id = 3. Isso leva ao fato de que o mesmo conteúdo / página pode ser acessado através de vários URLs diferentes e, em alguns casos, pode ser exibido em diferentes layouts.

* Com os URLs SEF ativados no Joomla, os itens acima podem ser traduzidos para mais de 1 URL SEF para o mesmo artigo / conteúdo.



3. A perspectiva de SEO

Os modernos mecanismos de pesquisa e o Google , particularmente, estão cientes desse comportamento. Geralmente, eles fazem o possível para indexar e manter nos resultados de pesquisa o URL mais adequado para uma página. Além disso, o Google revelou que não existe uma " penalidade " real para conteúdo duplicado devido a isso.

No entanto, o principal problema no caso de o mesmo conteúdo / página ter sido indexado mais de uma vez é que você possivelmente está perdendo a classificação da página e o melhor desempenho possível de SEO , porque a classificação da página será dividida em mais de uma página em vez de 1 .

Com isso em mente, é aconselhável lidar com isso, em vez de permitir que os Mecanismos de pesquisa indexem URLs enquanto tentam adivinhar se URLs diferentes exibem o mesmo conteúdo ou conteúdo diferente.
Além disso, controlar seus URLs e o que o SE deve indexar pode ajudar a produzir uma melhor experiência do usuário como um todo, já que os usuários do site encontrarão a mesma página em apenas 1 URL padrão, além de produzir uma estrutura mais sólida para um site e seu gerenciamento. .



4. Como lidar com o conteúdo duplicado

  • Usando URLs canônicos para suas páginas.
    Os URLs canônicos instruirão o mecanismo de pesquisa sobre qual é o URL correto de uma página que eles devem rastrear e manter em seu índice.

  • Utilizando os metadados INDEX / NOINDEX, FOLLOW / NOFOLLOW. O uso desses metadados nas suas páginas instruirá os mecanismos de pesquisa se você desejar indexar ou não o conteúdo de uma página e seguir ou não os links encontrados nela.

  • Usando 301 redireciona / htaccess.
    Você pode redirecionar todos os outros URLs para o que deseja no principal. Isso pode ser alcançado com extensões SEF ou htaccess . Ambos fornecem grande poder; no entanto, o htaccess possui grande flexibilidade, considerando a capacidade de usar expressões regulares para todos os tipos de redirecionamentos / ou reescritas usando o mod_rewrite. Em relação às extensões J, quando necessário, geralmente uso o sh404SEF .

    Atualização: Como @Neil Robertson observou nos comentários: um redirecionamento importante é da versão não www do site para a versão www do site ou vice-versa. Adicione isso ao arquivo .htaccess para redirecionamento não www para www.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Como usar as Ferramentas para webmasters do Google As Ferramentas para webmasters do
    Google têm opções para ajustar o comportamento do rastreador com seus parâmetros de URL .

  • Usando Sitemaps
    Envie para os mecanismos de pesquisa a estrutura de URL do seu site.

  • Usando o arquivo Robots.txt, o
    Google e outros grandes SE respeitam o seu Robots.txt. Você pode instruí-los a não rastrear diretórios / caminhos de URL específicos.

Todas as opções acima podem ser combinadas para produzir o resultado desejado.

* Como em qualquer lugar, no Joomla, um bom planejamento e organização de conteúdo sempre ajudam a alcançar um resultado melhor. Especialmente com o Joomla, isso também envolve uma categorização de conteúdo limpa e uma estrutura de itens de menu.



5. Referências e links

Extensões Joomla SEO

Geralmente no Joomla, se você quiser lidar com isso de forma eficiente, você acabará instalando uma extensão SEO-SEF de terceiros.



Mais leitura:

FFrewin
fonte
1
uma das melhores respostas neste fórum :) muito útil. Obrigado @FFrewin
Joomler
1
Esta é uma excelente resposta. :) Para garantir a integridade, pode ser bom adicionar algumas informações sobre o redirecionamento da versão não www do site para a versão www do site ou vice-versa. Isso geralmente é esquecido, mas é provavelmente a principal causa de conteúdo duplicado em todos os sites (não apenas no Joomla).
Neil Robertson
Parece que o novo roteador finalmente verá a luz do dia no Joomla 3.8 e isso ajudará a simplificar os URLs sem precisar de uma extensão de terceiros.
Neil Robertson
1
@ NeilRobertson: Eu ainda acho que ainda há espaço para melhorias e mais trabalho é necessário para obter uma solução completa e eficiente para gerenciar URLs / duplicatas SEF no Joomla.
FFrewin
@FFrewin Eu concordo. Parece que algumas extensões de terceiros também precisam ser atualizadas para aproveitar o novo roteador.
Neil Robertson
0

Se eu tiver vários itens de menu no mesmo conteúdo, utilizarei Links do sistema / Alias ​​de itens de menu localizados no Gerenciador de menus. Aqui está um artigo antigo sobre isso; mas o método ainda existe hoje: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@ Neil, eu concordo 100% sobre o conteúdo que não seja www vs www sendo lido como duplicado. Aqui está o código que força o www a não ser www. Coloque-o no seu arquivo htaccess. Além disso, ele adiciona o protocolo de segurança https também. Esse código não é o único método, mas é o que eu uso com sucesso em muitos sites.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
yaya
fonte