Estou trabalhando em um site que oferecerá conteúdo localizado seguindo a language+region
abordagem descrita nesta página do W3.org (por exemplo, fr-CA
para conteúdo em francês canadense e fr-FR
para conteúdo em "francês francês"). Como consideramos o conteúdo de cada um language+region
como único, é crucial para nós que os mecanismos de pesquisa identifiquem e veiculem adequadamente o conteúdo.
Ao pesquisar na Internet (por exemplo, esta pergunta ), parece que a maioria das pessoas recomenda o uso de um código de idioma ISO639 no lang
atributo HTML para descrever o idioma do conteúdo. Seguindo essa recomendação, usaríamos o <html lang="fr">
que não permitiria a diferenciação entre as language+region
combinações mencionadas acima .
Ao revisar a especificação HTML4 , parece que usar language+region
como código de linguagem seria perfeitamente bom, pois o en-US
exemplo é dado como um valor possível. No entanto, não consegui encontrar nenhuma confirmação disso na especificação HTML5, que parece não fornecer nenhum exemplo quanto aos possíveis valores permitidos.
A partir daí, tentei obter uma resposta de fato olhando o que os gigantes da web estão fazendo. Eu observei o que o Facebook está fazendo: eles oferecem versões em francês e francês francês dos sites da Candian com conteúdo (ligeiramente) diferente, enquanto o lang
valor do HTML permanece o mesmo:
URL fr-CA : http://fr-ca.facebook.com
Atributo HTML lang: <html lang="fr">
tradução da palavra 'email':courriel
URL fr-FR : http://fr-fr.facebook.com/
Atributo HTML lang: <html lang="fr">
tradução da palavra 'email':Adresse électronique
Qual é a maneira recomendada / padrão de descrever o conteúdo localizado usando a language+region
abordagem em HTML5?