Eu tenho um sitemap que é gerado diariamente com muitos links para páginas de produtos. Esses produtos são importados diariamente de outra fonte de dados. Como a atualização consiste em descartar todas as informações atuais do produto e substituí-las pelas novas informações importadas, a data da última modificação sempre salta um dia. Isso também é usado no mapa do site. Mesmo para produtos que não foram alterados. Todas as páginas de produtos fingem ter sido atualizadas.
O Google penalizará o site por fingir que as páginas foram alteradas dia após dia?
Minha solução seria alterar a entrada apenas se os novos dados do produto importado diferirem dos dados anteriores. Eu só quero ter certeza de que esta é uma atualização útil a ser feita, enquanto eu também poderia gastar meu tempo em outras melhorias.
fonte
Eu nunca gostei da idéia de atualizar
<lastmod>
todos os dias, pois não é apenas errado, é um mecanismo de pesquisa enganoso.Em um post publicado no SO , Gary Illyes, do Google, escreveu:
Eu geralmente defendi o uso
<lastmod>
correto ou não. Deixá-lo de fora (assim como<changefreq>
&<priority>
) torna o arquivo menor e mais rápido para os mecanismos de pesquisa lerem também.fonte
Não. O Google usará
lastmod
como dica (o mesmo que todos os valores do mapa do site), mas se decidir que seu conteúdo não está sendo atualizado diariamente, simplesmente o ignorará e revisitará suas páginas de acordo com sua própria programação.fonte
Não trabalho para o Google e não posso dizer com certeza o que eles realmente fazem, mas a maneira mais sensata de tratar os
<lastmod>
carimbos de data / hora seria como dicas para não perder tempo re-rastreando páginas que não foram alteradas.Portanto, se você reportar todas as suas páginas como alteradas todos os dias, o Googlebot continuará rastreando todas as suas páginas na ordem em que parecer, em vez de focar apenas nas páginas que foram alteradas. Com efeito, é como se você não tivesse relatado nenhum carimbo de data / hora da última modificação.
O principal motivo para fornecer
<lastmod>
registros de data e hora corretos é fazer com que as alterações no seu site sejam exibidas mais rapidamente no índice do Google. Se você possui centenas de páginas em seu site, o Google levará um tempo para rastrear todas elas e encontrar quaisquer alterações. No entanto, se você informar ao Googlebot quais páginas foram alteradas recentemente, ele poderá rastrear essas páginas primeiro e evitar perder muito tempo com o resto.Obviamente, você pode aumentar a taxa de rastreamento do Googlebot nas Ferramentas do Google para webmasters e esperar o melhor. Mas, realmente, não deve ser muito difícil fazer com que seu script de atualização preserve os registros de data e hora. Por exemplo, suponho que você esteja fazendo algo assim:
Nesse caso, basta alterá-lo para algo assim:
fonte
Não, simplesmente ignora as informações que você forneceu quando estão incorretas. Nesse caso, os rastreadores da Web descobrem sozinhos a frequência com que devem rastrear suas páginas.
fonte
O Google não o penalizará por isso. Para obter uma penalidade, você realmente precisa usar um chapéu preto na bunda do Google, então não se preocupe com isso. O Google descobrirá em breve se seu conteúdo sofrer alterações (é o que eles vêm trabalhando nos últimos anos) e usará a propriedade lastmod como uma dica.
fonte
Sugiro que você leia estas práticas recomendadas para sitemaps XML e feeds RSS / Atom
fonte