Sumário
Se o servidor exibir páginas com ligaduras (como o smartypants), os mecanismos de pesquisa serão inconsistentes. Atualmente, o Bing não indexa as ligaduras corretamente. Eu diria que, em geral, está pedindo problemas. Como os mecanismos de pesquisa mudam, há um método abaixo para você testar como os mecanismos de pesquisa estão interessados em ligaduras de índice .
Se os seus pratos servidor de páginas com texto normal, em seguida, Javascript os transforma em ligaduras, isso é bom . Os mecanismos de pesquisa não aplicam alterações no conteúdo Javascript antes da indexação das páginas (embora se afirme que existem algumas exceções, como carregar comentários do Facebook ). Como existe um método padrão da indústria para fornecer aos mecanismos de pesquisa conteúdo dinâmico e esse método é aprovado pelo Google , seria uma grande surpresa se isso mudasse no futuro. O Google recomenda que você navegue no site usando um navegador de texto sem formatação (por exemplo, eles sugerem o Lynx ) para ver seu conteúdo como um mecanismo de pesquisa o vê.
Mais detalhes sobre o primeiro caso (páginas distribuídas com ligaduras no código) ...
Em teoria
... não deve fazer diferença para um mecanismo de pesquisa bem configurado.
Primeiro, ajuda a entender a diferença entre glifos e caracteres . Uma ligadura fi
é um glifo que representa dois caracteres f
i
. Como o software trata, depende do contexto e da tarefa em questão - você verá a partir de exemplos nessa pergunta vinculada que, quando você copia e cola glifos, o que é colado varia: às vezes o glifo é colado, às vezes o glifo é tratado como seus caracteres associados f
e i
é colado.
Qualquer processador de texto automático bem-feito, interessado em semântica de texto (mecanismos de pesquisa, verificação ortográfica, leitores de tela ...) deve tratar um glifo como idêntico aos caracteres que representa e deve tratar finally
como idêntico finally
, porque esse é o texto significado do fi
glifo.
Na prática
Nem tudo é bem feito ...
Aqui está uma maneira fácil de testar os mecanismos de pesquisa. Aqui está uma linha de texto dessa outra pergunta:
Copy the ligature fi from Illustrator to this input box
Se pegarmos a versão sem ligaduras dessa sentença e a pesquisarmos entre aspas duplas:
(pesquisando "Copy the ligature fi from Illustrator to this input box"
):
- ... se um mecanismo de pesquisa tratar os glifos de ligadura como correspondências para os caracteres que representam, ele encontrará essa página (e, quando indexada, esta)
- ... se um mecanismo de pesquisa tratar os glifos de ligaduras como diferentes dos caracteres que eles representam, ele não encontrará nada até que esta página seja indexada; então, encontrará apenas esta página e as pesquisas com a versão de ligadura encontrarão essa página.
- ... se um mecanismo de pesquisa enlouquecer ao ver glifos como ligaduras completamente, não encontrará nada, nem mesmo esta página, e as pesquisas com a versão da ligadura também não encontrarão nada
Alguns resultados rápidos para os cinco principais mecanismos de pesquisa do mundo (os links são para resultados de pesquisa):
- Google: Bom (tipo 1) . (apesar do comentário abaixo, ele lida bem com a formatação de entidade unicode ou HTML)
- Bing: falha ( tipo 2 ).
- Yahoo: falha ( tipo 2 ) (o Yahoo é "Powered by Bing")
- Yandex (russo): bom (tipo 1)
- Baidu (chinês): erm, nenhuma página graphicdesign.stackexchange.com parece aparecer nas pesquisas do Baidu ... talvez estejamos banidos por lá ...?!
f
i
equivalente sem problemas. O Google parece lidar bem - mas, a inconsistência entre os diferentes mecanismos de pesquisa é (pelo menos no meu livro) uma quebra de negócio.Com base no exemplo ao vivo, vi que estaria extremamente preocupado com o uso extensivo disso, pois afetará o SEO. Os caracteres especiais são analisados como Unicode para que o algoritmo do Google não o leia. Deve ser bom para poupar usos, mas eu não enlouqueceria nem o usaria em nada importante como um título.
Aqui está o link para o exemplo ao vivo que eu olhei: http://pages.cs.wisc.edu/~wolfson/ligatures.html
fonte
l
i
f
i
etc (veja como ele as destaca na visualização). Mas eu definitivamente não quero nunca confiar nele ...