Pergunta simples, estou pedindo apenas para ter certeza.
Um gerador de sitemap do Google gerou um arquivo sitemap.txt com links escritos assim:
http://www.domain.com/category.htm?name=some-name&cat_id=8
é correto usar &
esses links no lugar de &
ou é apenas um erro cometido pelo gerador de sitemap?
Obrigado.
%26
): por exemplohttp://foo/a%26r.php?foo=1&genre=r%26b
CDATA
nó (notei que bdadam disse a mesma coisa, mas muito mais cedo do que eu)>
não precisa ser estritamente codificado em XML.Seu arquivo de Sitemap deve ser codificado em UTF-8 (geralmente você pode fazer isso quando salvar o arquivo). Como em todos os arquivos XML, quaisquer valores de dados (incluindo URLs) devem usar códigos de escape de entidade para os caracteres.
Isso pode ajudar, http://sitemaps.org/protocol.php
fonte
Você também pode se convencer verificando
Você realmente não pode argumentar contra a página oficial do protocolo xml sitemaps :)
fonte
O Google rejeita o mapa do site como quebrado se tiver um caractere & em um URL. Aceita quando você substitui o & pelo & amp;
MAS: se você verificar mais tarde a lista de erros de rastreamento na ferramenta de webmasters do Google, ele reportará esse URL do arquivo do mapa do site como quebrado, porque contém o & amp; ao invés de &.
Portanto, a solução correta é alterar a URL para que não contenha &. Ou relate isso como bug para o Google.
fonte
Codificação de URL e codificação de entidade XML não são as mesmas coisas. Você precisa de codificação de URL para substituir caracteres especiais em URLs, como & que pode ser usado apenas para a separação dos parâmetros de consulta. A codificação de entidade XML é para codificar caracteres especiais em XML (também XHTML). Isso significa que, se você tiver uma URL em um arquivo XML (ou XHTML), e essa URL incluir alguns caracteres &, será necessário codificá-la para o & amp ;. Portanto, em um sitemap.xml, você terá URLs como na pergunta de Marco Demaio.
fonte