Páginas canônicas no subdomínio que aparecem nos resultados de pesquisa do Google

8

Você deve ter ouvido falar que lançamos o Facebook Stack Overflow ontem.

Como parte disso, modificamos nosso código para colocar <meta rel="canonical" ...tags em todas as perguntas e usuários no domínio facebook.stackoverflow.com que aponta para o estouro de pilha "vanilla".

Por exemplo:

Erro do iAd "Inventário de anúncios indisponível" no facebook.stackoverflow.com
&
Erro do iAd "Inventário de anúncios indisponível" no stackoverflow.com

No facebook.stackoverflow, o html contém a metatag

<link rel="canonical" href="/programming/3720459/iad-error-ad-inventory-unavailable">

A intenção é dizer ao Google "são exatamente a mesma página, concede todo o page rank à cópia do Stack Overflow e a prefere nos resultados de pesquisa".

Este parece ser o ponto de rel = "canonical" .

Uma página canônica é a versão preferida de um conjunto de páginas com conteúdo altamente semelhante.

É comum que um site tenha várias páginas listando o mesmo conjunto de produtos. Por exemplo, uma página pode exibir produtos classificados em ordem alfabética, enquanto outras páginas exibem os mesmos produtos listados por preço ou classificação. Por exemplo:

Se o Google souber que essas páginas têm o mesmo conteúdo, poderemos indexar apenas uma versão para nossos resultados de pesquisa. Nossos algoritmos selecionam a página que achamos melhor responde à consulta do usuário. Agora, no entanto, os usuários podem especificar uma página canônica para os mecanismos de pesquisa adicionando um elemento com o atributo rel = "canonical" à seção da versão não canônica da página. A adição deste link e atributo permite que os proprietários do site identifiquem conjuntos de conteúdo idêntico e sugiram ao Google: "De todas essas páginas com conteúdo idêntico, esta página é a mais útil. Por favor, priorize-a nos resultados de pesquisa".

No entanto, estamos vendo os resultados do Stack Overflow do Facebook e, às vezes, eles até superam o Stack Overflow de baunilha ( um exemplo ). Talvez isso tenha algo a ver com ter um sitemap.xml independente para facebook.stackoverflow.com (uma espécie de cena no escuro)?

exemplo de resultado de pesquisa do Google

Então, o que estamos fazendo de errado aqui?

Esperamos manter as pesquisas do formulário site:facebook.stackoverflow.comfuncionando, mas desistir delas é totalmente aceitável se um total rel="noindex"for necessário.

Kevin Montrose
fonte

Respostas:

4

De acordo com a mesma página que você vinculou, rel="canonical" é apenas uma sugestão e não uma diretiva:

Rel = "canonical" é uma sugestão ou diretiva?

Essa nova opção permite que os proprietários do site sugiram a versão de uma página que o Google deve tratar como canônica. O Google levará isso em consideração, em conjunto com outros sinais, ao determinar quais conjuntos de URLs contêm conteúdo idêntico e ao calcular o mais relevante dessas páginas para exibição nos resultados de pesquisa.

É possível que o Google simplesmente tenha ignorado o URL canônico ou ainda não tenha atuado.

Mas a razão pela qual ela supera a questão do StackOverflow é provavelmente simples: (supondo que o Google esteja ignorando a rel="canonical"diretiva), o subdomínio do Facebook tem "facebook" na URL, o que carrega bastante peso no algoritmo de classificação do Google.

John Conde
fonte
Esperávamos canonicalcompensar isso ... acho que não. A edição relacionada dos resultados do FB.SO que aparece em uma página mesmo sem um termo de pesquisa no Facebook ( exemplo ) parece que o Google está apenas ignorando a sugestão.
Kevin Montrose
11
O Google parecia trabalhar com a SO na questão de conteúdo duplicado, onde outros sites estavam superando a SO pelo conteúdo original da SO. Gostaria de saber se eles olhariam para isso também?
John Conde
3

Vejo que esse problema está se resolvendo agora. Você pode testar fazendo uma consulta info: no Google assim, que exibe o novo URL.

resultado do google para facebook.stackoverflow.com/q/3720459

O problema da etiqueta canônica é que ela é uma diretiva, o que significa que ela não funciona 100% do tempo. Os redirecionamentos 301 são iguais - eles nem sempre passam 100% do peso pelo redirecionamento.

Também com qualquer um deles, o Google leva algumas semanas para entender que eles estão lá para ficar e devem ser seguidos. Este é um problema com as novas páginas porque elas são publicadas e estarão no URL errado por alguns dias / semanas antes que o Google siga o canônico.

Patrick Altoft
fonte