Um arquivo de Sitemap ajuda os mecanismos de pesquisa a descobrir URLs novos e atualizados em seu site. Em particular, se o seu site for bastante grande, isso poderá ajudá-los a se concentrar no conteúdo novo e atualizado, em vez de ter que percorrer tudo cegamente para ver se alguma coisa mudou. Isso pode resultar na descoberta de novos conteúdos muito mais rapidamente, o que pode ser bastante perceptível, especialmente se o site for maior ou mais complexo.
Com o Google em particular (trabalho no Google; não sei como outros mecanismos de pesquisa lidam com isso), ele também faz o seguinte:
- Encontre o número de URLs indexados para o seu site: essas estatísticas são recalculadas diariamente e são muito precisas. Você pode encontrá-los na página de detalhes dos Sitemaps .
- Descubra problemas de canonização: se os números correspondentes não corresponderem , isso significa que você está especificando URLs no arquivo Sitemap que não correspondem ao que encontramos durante o rastreamento. Isso geralmente é um sinal de que você precisa trabalhar na canonização .
- Ajuda com a canonização: quando encontrarmos no seu site vários URLs que mostram conteúdo idêntico, daremos a qualquer URL listado em um Sitemap uma vantagem extra, mesmo que você não use outros métodos de canonização.
- Encontre partes mal indexadas do seu site: essas contagens são fornecidas por arquivo Sitemap, para que você possa criar arquivos separados para seções lógicas do site, para descobrir áreas em que o Google não está indexando tanto quanto você gostaria.
- Priorizar erros de rastreamento: na seção erros de rastreamento , os URLs especificados nos arquivos de Sitemaps são listados separadamente. Como você forneceu esses URLs especificamente, assumimos que você deseja indexá-los e que quaisquer erros de rastreamento são importantes.
Além disso, você pode usar várias extensões nos arquivos de Sitemaps (por exemplo, imagens, vídeo, Notícias ou internacionalização), caso opte por fazê-lo. Essas extensões são todas opcionais.
Para a maioria dos sites, o elemento mais visível dos arquivos de Sitemaps é que você pode ver a contagem de URLs indexados. Pode demorar um dia ou mais para aparecer. Portanto, se você acabou de enviar um Sitemap pela primeira vez, pode ser um pouco paciente. Embora outras maneiras (por exemplo, um site: -query) sejam aproximações muito, muito grosseiras, essa contagem é extremamente precisa.
Editado para adicionar: outra coisa que considero extremamente útil em relação aos Sitemaps é que, se você não os está gerando diretamente com o seu CMS, invariavelmente descobrirá muito sobre como o site é rastreável e que tipo de URL é descoberto durante esse processo. Eu já vi muitos casos em que o rastreamento de um site com uma ferramenta do seu lado (por exemplo, um gerador de Sitemaps) elimina problemas que você pode perder de outra forma, seja o ID da sessão nos URLs, o conteúdo duplicado por diferenças de URL, espaços infinitos (como como calendários sem fim) ou mesmo partes de um site que não estão vinculadas.
Se você não estiver recebendo nenhum erro, pode presumir que o Google o analisou e está ciente do conteúdo. Mas isso não significa que eles rastrearão e / ou indexarão essas páginas. Os Sitemaps são apenas outra maneira de informar os mecanismos de pesquisa sobre suas páginas. Eles não são obrigados a rastrear e indexar uma ou todas essas páginas. O mesmo se aplica à localização de páginas por meio de links ou envios de URL.
fonte
O Google geralmente faz um bom trabalho de rastrear seu site se você tiver um bom número de links de qualidade. Se você está gastando muito tempo olhando o número de páginas indexadas, sugiro que seja melhor melhorar seu site e obter alguns links de qualidade.
fonte
Talvez uma ferramenta de validação de mapa do site como esta , embora eu nunca "não" tenha visto o mapa do site começar a funcionar.
fonte
Para sites maiores, por exemplo, sites com centenas, milhares ou milhões de páginas, é bastante útil. Tivemos em nosso site da empresa 400.000 páginas em que URLs foram criados dinamicamente por ID de conteúdo e parâmetros de URL foram usados com &, as Ferramentas do Google para webmasters fornecerão feedback sobre as páginas rastreadas e mostrarão erros, você pode depurar ou abrir a página e veja por si mesmo o que está errado. Dessa forma, o Google nos ajudou a criar um site melhor e nos poupou do enorme embaraço algumas vezes.
Também é útil ver o número de páginas indexadas versus o número de rastreados.
Para sites menores, se o site for um pequeno grupo de páginas .html em que cada página é vinculada por meio de menu e o site não for atualizado com frequência, se você fizer o upload do mapa do site, nada será alterado nos resultados da pesquisa. Você não terá nenhuma vantagem de enviar o mapa do site sobre alguém que não o enviou.
Eu também costumava ter cerca de 20 sites pequenos, nos quais os sitemaps eram gerados automaticamente pelo script cron e parei de fazer isso. Um dia, descobri que os arquivos XML não são gerados corretamente por cerca de 6 meses por meu erro, mas felizmente o Google ignorou meu erro e indexou esses sites totalmente, mesmo quando os sitemaps apresentavam erros, o Google usa o sitemap apenas como uma dica para onde ir, não muito sério.
fonte