Perguntas com a marcação «robots.txt»

Robots.txt é um arquivo de texto usado pelos proprietários do site para fornecer instruções sobre o site aos robôs da web. Basicamente, ele informa aos robôs quais partes do site estão abertas e quais estão fechadas. Isso é chamado de Protocolo de exclusão de robôs.

19
Como desaprovo um diretório inteiro com o robots.txt?

Atualmente, tenho dois sites em que estou trabalhando: um carrinho de compras e outro comprador. Ambos estão com o mesmo nome de domínio. Por exemplo, http://example.com/first_url http://example.com/second_url Ambos os URLs têm toneladas de páginas abaixo deles

17
O Google armazena em cache o robots.txt?

Adicionei um arquivo robots.txt a um dos meus sites há uma semana, o que deveria ter impedido o Googlebot de tentar buscar determinados URLs. No entanto, neste fim de semana, vejo o Googlebot carregando esses URLs exatos. O Google armazena em cache o robots.txt e, em caso afirmativo,...

14
O que é um arquivo robots.txt válido mínimo?

Não gosto de ver muitos erros 404 no access.log do meu servidor web. Estou recebendo esses erros porque os rastreadores tentam abrir um arquivo robots.txt , mas não conseguiram encontrar nenhum. Então, eu quero colocar um arquivo robots.txt simples que impeça que os erros 404 apareçam no meu...

12
Robots.txt - CSS permite ou não permite

CSS e modelos são permitidos no robots.txt ? Deve causar algum problema? No Joomla, CSS e modelos não são permitidos no robots.txt . Por favor, ajude-me a encontrar uma solução para colocar ou não a proibição de robôs para CSS, modelos etc. nos meus próximos

11
O Google Preview obedece ao Robots.txt?

Porque com certeza parece. Para meus sites, proibimos o diretório de imagens e as visualizações são todas imagens ausentes, o que faz com que o site pareça instável. É esse o caso e existe uma maneira de permitir que apenas o bot de visualização acesse as imagens usando o robots.txt? EDIT:...

10
Combinar user-agents no robots.txt

Os user-agents podem ser listados juntos, seguidos por suas regras comuns em um robots.txt ? User-agent: Googlebot User-agent: ia_archiver #Alexa User-agent: BingPreview #Microsoft User-agent: bingbot #Microsoft User-agent: MSNBot #Microsoft User-agent: Slurp #Yahoo User-agent: Ask Jeeves/Teoma...