URL canônico para uma página inicial e barras finais

14

Minha página inicial pode estar potencialmente vinculada como:

http://example.com
http://example.com/
http://example.com/?ref=1
http://example.com/index.html
http://example.com/index.html?ref=2

(the same page is served for all those URLs)

Estou pensando em definir um URL canônico para garantir que o Google não considere esses URLs como páginas diferentes:

<link rel="canonical" href="/webmasters//" /> (relative)
<link rel="canonical" href="http://example.com/" /> (trailing slash)
<link rel="canonical" href="http://example.com" /> (no trailing slash)

Qual deles deve ser usado? Eu daria um tapa, /mas mexer com canônicos parece um negócio assustador, então eu queria checar novamente primeiro.

É uma boa ideia definir um URL canônico para uma página inicial?

serg
fonte

Respostas:

14

De acordo com o RFC 2616 (HTTP / 1.1), seção 3.2.2 , os URLs http://www.example.come http://www.example.com/são equivalentes, e os clientes HTTP devem normalizar o primeiro para o segundo antes de enviar a solicitação ao servidor:

"Se o abs_path não estiver presente na URL, DEVE ser indicado como" / "quando usado como um Request-URI para um recurso ( seção 5.1.2 )."

onde a seção 5.1.2 diz:

"Observe que o caminho absoluto não pode estar vazio; se nenhum estiver presente no URI original, DEVE ser fornecido como" / "(a raiz do servidor)."

O RFC 3986 (sintaxe genérica de URI) confirma isso na seção 6.2.3, Normalização baseada em esquema , observando que:

"Por exemplo, porque o esquema" http "utiliza um componente de autoridade, possui uma porta padrão" 80 "e define um caminho vazio para ser equivalente a" / ", os quatro URIs a seguir são equivalentes:

    http://example.com
    http://example.com/
    http://example.com:/
    http://example.com:80/

Em geral, um URI que usa a sintaxe genérica para autoridade com um caminho vazio deve ser normalizado para um caminho "/". Da mesma forma, um ": port" explícito, para o qual a porta está vazia ou o padrão para o esquema, é equivalente a um onde a porta e seu delimitador ":" são elididos e, portanto, devem ser removidos pela normalização baseada em esquema. Por exemplo, o segundo URI acima é o formato normal para o esquema "http".

Tecnicamente, a normalização descrita na seção 6.2.3 da RFC 3986 é opcional para implementações que, por exemplo, meramente indexam URLs, embora a RFC 2616 torne obrigatória para clientes que desejam realmente enviar solicitações HTTP. Ainda assim, considerando que o padrão permite essa normalização e que os mecanismos de pesquisa geralmente não desejam adicionar deliberadamente duplicatas ao seu índice, pode-se ter certeza razoável de que praticamente todos os mecanismos de pesquisa normalizarão todos esses URLs.

Portanto, não faz diferença para navegadores ou mecanismos de pesquisa, independentemente de você usar http://www.example.comou http://www.example.com/. Eles são equivalentes.

Ilmari Karonen
fonte
5
http://www.example.come http://www.example.com/pode ser equivalente, mas http://www.example.com/é o canônico porque é para isso que os URIs devem ser normalizados. Então, eu o usaria na metatag canônica.
Stephen Ostermiller