Acabei de atualizar meu arquivo robots.txt em um novo site. As Ferramentas do Google para webmasters relatam que ele leu meu robots.txt 10 minutos antes da minha última atualização.
Existe alguma maneira de incentivar o Google a reler meu robots.txt o mais rápido possível?
UPDATE: Em Configuração do Site | Acesso do rastreador | Teste robots.txt:
O acesso à página inicial mostra:
O Googlebot está bloqueado em http://my.example.com/
FYI: O robots.txt que o Google leu pela última vez é assim:
User-agent: *
Allow: /<a page>
Allow: /<a folder>
Disallow: /
Eu levei um tiro no meu pé ou, eventualmente, ele lerá: http: ///robots.txt (como na última vez que o leu)?
Alguma idéia do que eu preciso fazer?
Respostas:
Caso alguém encontre esse problema, existe uma maneira de forçar o google-bot a baixar novamente o arquivo robots.txt.
Vá para Health -> Fetch como Google [1] e solicite /robots.txt
Isso baixará novamente o arquivo e o Google também analisará novamente o arquivo.
[1] na interface do usuário anterior do Google, era 'Diagnostics -> Fetch as GoogleBot'.
fonte
Disallow: /
. Em vez disso, os relatórios de busca "Negado pelo robots.txt": /.Sei que isso é muito antigo, mas ... Se você fez o upload do robots.txt errado (não permitindo todas as páginas), tente o seguinte:
como o google tenta ler o mapa do site xml, ele verifica novamente o robots.txt, forçando o google a reler seu robots.txt.
fonte
ESTÁ BEM. Aqui está o que eu fiz e, em poucas horas, o Google releu meus arquivos robots.txt.
Temos 2 sites para cada 1 site em execução. Vamos chamá-los de site canônico (www.mysite.com) e site de domínio simples (mysite.com).
Temos nossos sites configurados para que mysite.com sempre retorne um redirecionamento 301 para o site www.mysite.com.
Depois de configurar os dois sites nas ferramentas do Google para webmasters, informando que o site www.mysite.com é o site canônico, ele logo após leu o arquivo robots.txt no site canônico.
Eu realmente não sei por que, mas foi o que aconteceu.
fonte
Diminua o intervalo de verificação do Google por alguns dias.
Além disso, já vi o botão confirmar o seu robots.txt, isso pode forçá-lo ao Google, mas não tenho certeza.
fonte