No robots.txt, posso escrever o seguinte URL relativo para o arquivo do sitemap?
sitemap: /sitemap.ashx
Ou tenho que usar o URL completo (absoluto) para o arquivo do sitemap, como:
sitemap: http://subdomain.domain.com/sitemap.ashx
Por que eu me pergunto:
- Eu possuo um novo serviço de blog, www.domain.com, que permite que os usuários façam blog em accountname.domain.com.
- Como uso curingas, todos os subdomínios (contas) apontam para: "blog.domain.com".
No blog.domain.com, coloquei o robots.txt para permitir que os mecanismos de pesquisa encontrem o mapa do site. Mas, devido aos curingas, todas as contas de usuário compartilham o mesmo arquivo robots.txt. É por isso que não posso usar a segunda alternativa. E por enquanto não posso usar a reescrita de URL para arquivos txt. (Eu acho que as versões posteriores do IIS podem lidar com isso?)
fonte
robots.txt
sem a capital R.http
ehttps
, você deve fornecer apenas um mapa do site (com a variante canônica) .Os rastreadores do Google não são inteligentes o suficiente, eles não podem rastrear URLs relativos, por isso é sempre recomendável usar URLs absolutos para melhorar a rastreabilidade e a indexabilidade.
Portanto, você não pode usar esta variação
A sintaxe recomendada é
Nota:
fonte
Boa pergunta técnica e lógica, meu querido amigo. Não no arquivo robots.txt, você não pode usar o URL relativo do mapa do site; você precisa ir com o URL completo do mapa do site.
É melhor usar "sitemap: https://www.example.com/sitemap_index.xml "
No URL acima, após os dois pontos, há espaço. Também gosto de apoiar o Deepak.
fonte