Porque com certeza parece. Para meus sites, proibimos o diretório de imagens e as visualizações são todas imagens ausentes, o que faz com que o site pareça instável.
É esse o caso e existe uma maneira de permitir que apenas o bot de visualização acesse as imagens usando o robots.txt?
EDIT: Parece que as visualizações são geradas pelo Google Bot normal e por um bot on-the-fly Google Web Preview, conforme mencionado (brevemente) no Blog da Central do webmaster .
Usando um site: search e meu software de monitoramento, eu pude ver quando o bot atingiu meu site e quando isso aconteceu, as imagens apareceram muito bem na visualização. Portanto, meu palpite é que o rastreador normal ignora as imagens por robots.txt, mas o rastreador de visualização obtém as imagens de qualquer maneira.
Essa implementação parece meio complicada porque minhas opções parecem ser:
- permitir que o google bot rastreie minhas imagens (o que não quero fazer)
- use a tag nosnippet que bloqueia a visualização, mas TAMBÉM snippets (o que eu não quero fazer)
- Deixe aparecer as visualizações precárias que podem afetar adversamente os cliques
fonte
Respostas:
Eu acho que John Mueller estava certo nos comentários.
Eu não sabia que você poderia permitir que o Google indexasse conteúdo sem indexá-lo. Eu coloquei sua técnica no lugar e estou apenas esperando para ser rastreado para ver se funcionou.
Aceitarei isso como resposta em alguns dias, a menos que John queira adicionar seus comentários à seção de respostas para que ele possa ganhar o representante.
fonte
Como a maior parte da visualização é feita pelo rastreador de bots do Google, o bloqueio de parte de seu site afetará a visualização ...
Por que você não deseja permitir que o bot do Google rastreie suas imagens?
fonte
A seguir, é apresentada uma solução técnica que pode ou não ser aplicada simplesmente ao seu site.
É possível (até provável) que o Google tenha uma maneira de fazer isso com apenas algumas dicas em metadados ou robots.txt, mas até então ...
Passo 1.
Crie um serviço / servlet de redirecionamento para imagens da primeira página.
Ou seja, um URL como
/frontpageimages/[image name]
que um servidor redireciona para
/images/[image name]
Passo 2.
Reescreva todos os links de imagem da página inicial (e somente a página inicial) para passar pelo serviço de redirecionamento da etapa 1, em vez de vincular diretamente à imagem.
Etapa 3.
Verifique se o robots.txt permite que o googlebot rastreie
/frontpageimages/
Isso deve garantir que o Google possa rastrear as imagens que encontrar na sua página inicial, deixando as imagens em outras páginas.
Embora o serviço de redirecionamento possa (em teoria) ser usado para rastrear todas as suas imagens sem violar tecnicamente o seu robots.txt, não é algo que robôs bem comportados (como o googlebot) farão. E robôs mal comportados não vão se preocupar com o robots.txt.
fonte