Por que alguns sites adicionam “Slugs” ao final das URLs? [fechadas]

111

Muitos sites, incluindo este, adicionam o que são aparentemente chamados de slugs - descritivos, mas, pelo que posso dizer, pedaços de texto inúteis - ao final dos URLs.

Por exemplo, o URL que o site fornece para esta pergunta é:

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

Mas o seguinte URL funciona tão bem:

/programming/47427/

O objetivo deste texto é apenas tornar a URL mais amigável ou existem outros benefícios?

Dave Webb
fonte
44
slugs servem como nome do identificador de chamadas da URL. Quando você recebe uma ligação, não é necessário saber o nome da pessoa, mas ajuda você a decidir se deseja atender o telefone ou não. Da mesma forma, um slug de URL ajuda o usuário a decidir se deseja clicar no link e fornece algum contexto intrínseco.
Armstrongest de
4
^^ +1, mas teria sido melhor ver sua resposta como uma Resposta em vez de um comentário ..
Dienekes
ajuda com classificações nos resultados de pesquisas.
Jay Smoke
stackoverflow.com/q/47427 também funciona: P
Habeeb Perwad

Respostas:

166

Os slugs tornam o URL mais amigável e você sabe o que esperar ao clicar em um link. Mecanismos de busca como o Google, classificam as páginas mais alto se a palavra de busca estiver no URL.

Espo
fonte
3
Uma das coisas que tornam um url amigável é a "capacidade de descoberta", o que significa que você pode adivinhar o url simplesmente na barra de endereço. i.love.pets.com/search/cats+dogs pode facilmente levar a i.love.pets.com/search/pug+puppies etc
Xian
12
Xian, já ouvi esse argumento antes, mas não acho que resista a um exame minucioso. Além dos geeks, quase ninguém realmente digita URLs diretamente. A legibilidade é definitivamente importante e acho que um número crescente de usuários os URLs, mas quando se trata de "adivinhar", acho que a minoria é extremamente pequena.
ausência de pálpebras
4
@eyelidlessnes - Terei que discordar. Embora as pessoas possam não inserir URLs manualmente, tenho visto evidências de que elas os criam. Observando nossos logs e nossos dispositivos de monitoramento, vemos exemplos em que uma sessão de usuário fará algo e, em seguida, modificará a URL (evidenciado pela falta de um referenciador). Concedido, nem todo mundo está fazendo isso - mas definitivamente não é uma quantidade desprezível de tráfego.
Joseph Ferris
@Xian. Sim, poucos digitam URLS, no entanto, o slug é essencialmente o identificador de chamadas. O nome do chamador não é NECESSÁRIO, mas ajuda você a decidir se deseja atender a chamada ou não. slugs tornam um URL mais amigável e aumenta a probabilidade de o usuário clicar nele.
Armstrongest,
xian, exatamente como isso é diferente de google.com/search?q=cat+puppy? Pessoas que descobrem URLs provavelmente farão isso. Eu faço isso.
netrox
39

Usabilidade é um dos motivos, se você receber aquele link em seu e-mail, sabe o que esperar. SEO (search engine optimization) é outro motivo. Mecanismos de pesquisa como o Google classificarão sua página em posições mais altas para as palavras-chave contidas no url

Michiel van Oosterhout
fonte
2
Por que você acha que o Google tomou essa decisão? O que o motivou?
Mike Clark
Você pode encontrar alguma documentação do Google que afirme especificamente que eles terão uma classificação superior em uma página se a palavra-chave estiver contida no url?
corrente de
@chainwork Não, mas existem centenas de sinais que um mecanismo de pesquisa usa para classificar as páginas, e você pode ter certeza de que o URL é um desses sinais.
Michiel van Oosterhout
2
Palavras-chave na url que correspondem à pesquisa estão em negrito nos resultados do Google, tornando-as mais destacadas para os usuários que realizam a pesquisa.
corrente de
35

Recentemente, alterei o formato do URL do meu site de:

www.mywebsite.com/index.asp?view=display&postid=100

Para

www.mywebsite.com/this-is-the-title-of-the-post

e percebi que as taxas de cliques para o artigo aumentaram cerca de 300% após a mudança. Certamente ajuda o usuário a decidir se o que ele está pensando em clicar é relevante, em termos de objetivos de SEO, embora eu deva dizer que vi pouco impacto após a mudança

Katy
fonte
4
Espero que os títulos dos seus posts nunca, nunca mudem: muitas pessoas odeiam links mortos e serviços da web que os produzem.
Nikita Rybak
6
Eu realmente não consigo adivinhar qual CMS ou software de blog ele está usando, mas para WordPress e muitos outros semelhantes, modificar o título da postagem depois que ela já foi publicada não altera o slug (e exatamente pelo motivo que você mencionou).
Cyde Weys
25

Concordo com outras respostas de que qualquer slug digitado incorretamente deve redirecionar 301 para o formulário adequado. Em outras palavras, /programming/47427/whdeve redirecionar para /programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls. Tem um outro benefício que não foi mencionado - se você não fizer um redirecionamento para um URL canônico, parecerá que você tem um número quase infinito de páginas duplicadas. O Google odeia conteúdo duplicado.

Dito isso, você deve realmente se preocupar apenas com o ID do conteúdo e permitir qualquer entrada para o slug, desde que redirecione. Por quê?

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

... Opa, o software de e-mail cortou o final da URL! Não tem problema, porque você ainda pode rolar com apenas/programming/47427

O único grande problema com essa abordagem é se você deriva do título de seu conteúdo, como vai lidar com títulos não ASCII, UTF-8?

Cory R. King
fonte
1
Belo post, ponto muito válido! +1 Quanto à sua pergunta, "como você vai lidar com títulos UTF8 não ASCII?" Existem algoritmos para isso, por exemplo, o que o WordPress usa. Eu postaria uma solução PHP para esse problema exato se mais de 600 caracteres fossem permitidos. Se você realmente deseja saber, poste como uma pergunta e terei o maior prazer em respondê-la;)
Mathias Bynens
1
re: "número quase infinito de páginas duplicadas" - isso só acontecerá se houver links para o URL não canônico. Se você o mantiver consistente em seu site, não haverá problema. Sua teoria sobre URLs sendo cortados é meio boba, o URL poderia ser cortado em qualquer lugar, certo? Mesmo depois de 4742, o que levaria a uma questão diferente. Contanto que você se restrinja apenas às letras, números, travessões e / ou sublinhados padrão no URL, é menos provável que aconteça.
DisgruntledGoat
2
Como DisgruntledGoat sugeriu, o Google tecnicamente não encontraria nenhum conteúdo duplicado, a menos que alguém vinculasse a página com um slug diferente, enganando, portanto, a aranha do Google a pensar que há conteúdo duplicado. Então a aranha vai odiar esta página, muito bem, pessoal;)
Austyn Mahoney
Tecnicamente, você não precisa fazer um redirecionamento 301 se incorporar a dica rel = "canonical" na página. Independentemente do "número quase infinito de páginas duplicadas", o Google usará o único URL canônico válido. A Amazon não faz o 301. Experimente: amazon.com/lat-thinking-stragies/dp/0470942185 No entanto, é melhor fazer os dois. A razão é que alguém pode publicar o link com um slug totalmente modificado e quando o visualizador o lê, parece diferente do conteúdo - confundindo o visualizador.
Ethan
"como você vai lidar com títulos UTF8 não ASCII?" Você os codifica por cento. Todos os navegadores modernos mostrarão o Unicode em toda a sua glória multilíngue na barra de endereço, mas fornecerão um URL ASCII codificado por cento quando você copiar para a área de transferência.
Stijn de Witt
14

A razão pela qual a maioria dos sites o usa é provavelmente o SEO (Search Engine Optimization). O Yahoo costumava dar um peso razoável à presença da palavra-chave de pesquisa no próprio URL e também ajudou no resultado do Google.

Mais recentemente, os mecanismos de pesquisa reduziram o peso dado às palavras-chave no URL, provavelmente porque a técnica agora é mais comum em sites de spam do que legítima. Agora, as palavras-chave no URL têm apenas um impacto mínimo nos resultados da pesquisa, se é que têm.

Quanto ao stackoverflow em si, SEO pode ser uma motivação (velhos hábitos são difíceis de morrer) ou simplesmente para usabilidade.

DGentry
fonte
SEO é um fator. Mas o mais importante, é sobre usabilidade, como você disse.
Armstrongest,
14

É basicamente um local mais significativo para o recurso. Usar o ID é perfeitamente válido, mas significa mais para as máquinas do que para as pessoas.

Estritamente falando, o ID não deve ser necessário se o slug for exclusivo, você pode garantir mais facilmente slugs exclusivos definindo o escopo dentro de datas.

ie:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/

Basicamente, isso explora a baixa probabilidade de duas lesmas idênticas estarem em uso no mesmo dia. Se houver um conflito, a convenção geral é adicionar um contador no final do slug, mas é raro que você veja estes:

/2008/sept/06/why-some-websites-add-slugs-end-of-urls/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-1/
/2008/sept/06/why-some-websites-add-slugs-end-of-urls-2/

Muitos algoritmos slug também eliminam palavras comuns como "o" e "a" para ajudar a manter o URL curto. Essa abordagem com escopo também torna muito simples encontrar todos os recursos para um determinado dia, mês ou ano - você simplesmente corta os segmentos.

Além disso, os URLs stackoverflow são ruins no sentido de que introduzem um segmento adicional para apresentar o slug, o que é uma violação da ideia de que cada segmento deve representar uma hierarquia de recursos decrescente.

Andrew Ingram
fonte
11

O termo lesma vem do ramo de jornais / publicações. É um título curto usado para identificar uma história em andamento. Pessoas interessadas em semântica de URL começaram a usar um título curto e abreviado em seus URLs. Também vale a pena na terra do SEO, pois as palavras-chave nos URLs adicionam importância a uma página.

Ironicamente, muitos sites começaram a colocar uma versão completa serializada com hífens dos títulos em seus URLs para fins estritamente de SEO, o que significa que o termo slug não se aplica mais. Isso também irrita os puristas semânticos, já que muitas implementações simplesmente incluem essa versão serializada do título no final de seus URLs.

Alan Storm
fonte
10

Noto que você pode alterar o texto livremente. Este URL parece funcionar tão bem.

/programming/47427/why-is-billpg-so-very-awesome

billpg
fonte
Esse tipo é um bug ou recurso?
Jakub Šturc
4
Na verdade, ele garante que você pode acessar uma postagem mesmo depois que o assunto foi modificado (e, portanto, há uma nova URL).
Dirk Vollmar
3
Porém, o ideal é que cada recurso da Internet ('documento') tenha apenas 1 URI. Portanto, basicamente, permitir que o mesmo documento seja visualizado por meio de URIs diferentes pode ter uma influência negativa em seu site na SERP. Esta é provavelmente a única coisa que eu não gosto no Stack Overflow;)
Mathias Bynens
3
É por isso que as páginas canônicas existem e o Stack Overflow as usa. =)
Alix Axel
4
@Alix Axel: 301 redireciona >páginas canônicas
Mathias Bynens
6

Como já foi dito, o 'slug' ajuda as pessoas e os buscadores ...

Algo que vale a pena notar, é que na fonte da página existe um url canônico

Isso impede que a página seja indexada várias vezes.

Exemplo:

<link rel="canonical" href="http://stackoverflow.com/questions/47427/why-do-some-websites-add-slugs-to-the-end-of-urls">
Robs
fonte
3

Não se esqueça da legibilidade ao enviar um link, não apenas nos motores de busca. Se você enviar um e-mail para alguém com o primeiro link, essa pessoa poderá ver o URL e ter uma ideia geral do que se trata. O segundo não dá nenhuma indicação do conteúdo da página antes do clique.

Chris Bartow
fonte
2

Se você enviasse um link por e-mail para alguém, não faria mais sentido incluir uma descrição escrevendo uma descrição em vez de fazer a outra pessoa analisar o URL onde a descrição existe e tentar ler um monte de -hyphenated-words-stick-together.

Kibee
fonte
Obviamente, você nunca foi Rick Roll, não é? Quantos links você recebe que são: Confira. Hilário! <link>. Seria bom se o Youtube fizesse Urls como este: youtube.com/12345/evil-bikini-wax-job-not-work-safe. Isso tornaria os links mais confiáveis ​​e me ajudaria a tomar a decisão de clicar ou não.
Armstrongest,
1
Seria, no entanto, qualquer sistema MVC que eu vi não exigiria a parte extra do trabalho de cera de biquíni maldoso não seguro e poderia ser facilmente enviado para youtube.com/12345, e a maioria das pessoas quem quisesse enviar coisas como essa aprenderia rapidamente a removê-las.
Kibbee de
2

Em primeiro lugar, é SEO e amigável, mas no caso do exemplo (este site), não é bem ou feito corretamente (já que está aberto a truques de chapéu preto e envenenamento por outros, o que refletiria mal neste site) .

E se

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

tem o conteúdo, então

/programming/47427/

e

/programming/47427/any-other-bollix

não deve ser duplicado. Eles devem detectar automaticamente que o link seguido não está usando o texto atual (já que obviamente o slug é definido pelo título da pergunta e pode ser editado posteriormente) e devem redirecionar 301 automaticamente para

/programming/47427/why-do-some-websites-add-slugs-to-the-end-of-urls

garantindo assim a regra "um conteúdo para um URI" e, se o URI se mover / mudar, garantir que os favoritos antigos o sigam / movam por meio de redirecionamentos 301 (para que navegadores inteligentes possam atualizar os favoritos).

Alan Doherty
fonte
1
Visualize o código-fonte da página e você encontrará o seguinte: <link rel = "canonical" href = " stackoverflow.com/questions/47427/… "> Veja: aqui: googlewebmastercentral.blogspot.com/2009/02/…
Armstrongest
0

Idealmente, o "slug" deve ser o único identificador necessário. Na prática, em sites dinâmicos como este, você precisa ter um identificador numérico único ou começar a acrescentar / incrementar números ao "slug" como o Digg faz.

Kyle Cronin
fonte
1
O link Digg foi o primeiro que encontrei ao descer a página principal. É pura coincidência que também exemplifique o quão longe Digg caiu - uma história sobre o vício em sexo foi postada três vezes.
Kyle Cronin