Qual é o efeito das ligaduras na web em relação ao SEO

19

Todos os designers adoram ligaduras, mas a tipografia baunilha é uma merda. Ouvi falar de smartypants que resolve muitos desses problemas, trazendo citações sensuais, e comercial maravilhoso e tudo. É perfeito, visualmente.

Mas estou preocupado com SEO. Digamos que em uma página da web, a palavra finallyse torne finally. Os mecanismos de pesquisa são capazes de indexar essa palavra e retornar a página ao pesquisar finally(sem a ligadura)?

TKrugg
fonte

Respostas:

3

Sumário

Se o servidor exibir páginas com ligaduras (como o smartypants), os mecanismos de pesquisa serão inconsistentes. Atualmente, o Bing não indexa as ligaduras corretamente. Eu diria que, em geral, está pedindo problemas. Como os mecanismos de pesquisa mudam, há um método abaixo para você testar como os mecanismos de pesquisa estão interessados ​​em ligaduras de índice .

Se os seus pratos servidor de páginas com texto normal, em seguida, Javascript os transforma em ligaduras, isso é bom . Os mecanismos de pesquisa não aplicam alterações no conteúdo Javascript antes da indexação das páginas (embora se afirme que existem algumas exceções, como carregar comentários do Facebook ). Como existe um método padrão da indústria para fornecer aos mecanismos de pesquisa conteúdo dinâmico e esse método é aprovado pelo Google , seria uma grande surpresa se isso mudasse no futuro. O Google recomenda que você navegue no site usando um navegador de texto sem formatação (por exemplo, eles sugerem o Lynx ) para ver seu conteúdo como um mecanismo de pesquisa o vê.


Mais detalhes sobre o primeiro caso (páginas distribuídas com ligaduras no código) ...


Em teoria

... não deve fazer diferença para um mecanismo de pesquisa bem configurado.

Primeiro, ajuda a entender a diferença entre glifos e caracteres . Uma ligadura é um glifo que representa dois caracteres f i. Como o software trata, depende do contexto e da tarefa em questão - você verá a partir de exemplos nessa pergunta vinculada que, quando você copia e cola glifos, o que é colado varia: às vezes o glifo é colado, às vezes o glifo é tratado como seus caracteres associados fe ié colado.

Qualquer processador de texto automático bem-feito, interessado em semântica de texto (mecanismos de pesquisa, verificação ortográfica, leitores de tela ...) deve tratar um glifo como idêntico aos caracteres que representa e deve tratar finallycomo idêntico finally, porque esse é o texto significado do glifo.

Na prática

Nem tudo é bem feito ...

Aqui está uma maneira fácil de testar os mecanismos de pesquisa. Aqui está uma linha de texto dessa outra pergunta:

Copy the ligature fi from Illustrator to this input box

Se pegarmos a versão sem ligaduras dessa sentença e a pesquisarmos entre aspas duplas:

(pesquisando "Copy the ligature fi from Illustrator to this input box"):

  1. ... se um mecanismo de pesquisa tratar os glifos de ligadura como correspondências para os caracteres que representam, ele encontrará essa página (e, quando indexada, esta)
  2. ... se um mecanismo de pesquisa tratar os glifos de ligaduras como diferentes dos caracteres que eles representam, ele não encontrará nada até que esta página seja indexada; então, encontrará apenas esta página e as pesquisas com a versão de ligadura encontrarão essa página.
  3. ... se um mecanismo de pesquisa enlouquecer ao ver glifos como ligaduras completamente, não encontrará nada, nem mesmo esta página, e as pesquisas com a versão da ligadura também não encontrarão nada

Alguns resultados rápidos para os cinco principais mecanismos de pesquisa do mundo (os links são para resultados de pesquisa):

  • Google: Bom (tipo 1) . (apesar do comentário abaixo, ele lida bem com a formatação de entidade unicode ou HTML)
  • Bing: falha ( tipo 2 ).
  • Yahoo: falha ( tipo 2 ) (o Yahoo é "Powered by Bing")
  • Yandex (russo): bom (tipo 1)
  • Baidu (chinês): erm, nenhuma página graphicdesign.stackexchange.com parece aparecer nas pesquisas do Baidu ... talvez estejamos banidos por lá ...?!
user56reinstatemonica8
fonte
Nah, acabei de editar minha resposta, confira o código-fonte nesse link. É todo unicode como & # xfb00; que o algoritmo do Google ignora.
Ryan
Na verdade, o Google faz corresponder àqueles: olhar para o que ele destaca aqui (ligaduras) e aqui (texto simples) - ambos jogo both.But Concordo com o seu conselho ...
user56reinstatemonica8
... (esses URLs eram enormes, precisam de 2 comentários), parece um convite a problemas. Se o bing não corresponder às ligaduras, outros serviços importantes também não.
usar o seguinte comando
Veja o URL do primeiro link e o código-fonte correspondente: você verá que o Google (atualmente ...) não tem problemas com a formatação unicode e indexa ligaduras unicode, ligaduras de entidade HTML e pares regulares de caracteres separados como f iequivalente sem problemas. O Google parece lidar bem - mas, a inconsistência entre os diferentes mecanismos de pesquisa é (pelo menos no meu livro) uma quebra de negócio.
usar o seguinte comando
3

Com base no exemplo ao vivo, vi que estaria extremamente preocupado com o uso extensivo disso, pois afetará o SEO. Os caracteres especiais são analisados ​​como Unicode para que o algoritmo do Google não o leia. Deve ser bom para poupar usos, mas eu não enlouqueceria nem o usaria em nada importante como um título.

Aqui está o link para o exemplo ao vivo que eu olhei: http://pages.cs.wisc.edu/~wolfson/ligatures.html

Ryan
fonte
Eu não acho que serão essas letras no código fonte. Parece que smartypants é uma coisa do lado do servidor que analisa a entrada e salva os glifos no texto armazenado no banco de dados e, portanto, também no código-fonte. Dito isto, acho que vai ser bom para SEO de qualquer maneira.
usar o seguinte comando
Na verdade, eu inspecionei o elemento, mas na verdade não vi a fonte. Vou editar minha resposta.
Ryan
1
Eu definitivamente concordo com o "extremamente preocupado", o suporte a Unicode é notoriamente inconsistente. Mas, para o registro, o Google pode (atualmente ...) indexar unicode e (atualmente ...) corresponde às ligaduras unicode nessa página com pesquisas por l i f ietc (veja como ele as destaca na visualização). Mas eu definitivamente não quero nunca confiar nele ...
user56reinstatemonica8
E se as ligaduras fossem colocadas através de javascript? Não alteraria o documento html, portanto seria completamente invisível para os mecanismos de pesquisa? Isso seria uma solução?
TKrugg #
Sim, isso deve ser bom - os mecanismos de pesquisa geralmente indexam o documento original sem aplicar o javascript. Você provavelmente desejaria verificar se isso não estava diminuindo significativamente o tempo de carregamento da página e se não há um choque chocante para o visualizador quando os caracteres vanilla são substituídos pelas ligaduras durante o carregamento da página.
usar o seguinte comando