Li as respostas nesta pergunta, mas elas ainda deixam minha pergunta em aberto: o Google armazena em cache o robots.txt?
Não encontrei uma maneira nas Ferramentas do Google para webmasters para invocar um novo download do meu robots.txt .
Por algum erro, meu robots.txt foi substituído por:
User-agent: *
Disallow: /
E agora todo o meu conteúdo foi removido dos resultados de pesquisa do Google.
Obviamente, estou interessado em corrigir isso o mais rápido possível. Já substitui o robots.txt , mas não consigo encontrar uma maneira de fazer o Google atualizar a versão em cache.
google
google-search-console
robots.txt
Der Hochstapler
fonte
fonte
Respostas:
Você não pode fazê-los baixar novamente o seu robots.txt quando desejar. O Google o rastreará novamente e usará os novos dados sempre que acharem apropriado para o seu site. Eles tendem a rastrear regularmente, para que eu não espere que o arquivo atualizado seja encontrado e que suas páginas sejam rastreadas e indexadas novamente. Lembre-se de que pode levar algum tempo depois que o novo arquivo robots.txt for encontrado antes que suas páginas sejam rastreadas novamente e ainda mais tempo para que elas reapareçam nos resultados de pesquisa do Google.
fonte
Eu enfrentei o mesmo problema quando iniciei meu novo site
www.satyabrata.com
em 16 de junho.Eu tinha um
Disallow: /
no meu robots.txt , exatamente como Oliver. Também havia uma mensagem de aviso nas Ferramentas do Google para webmasters sobre URLs bloqueados.O problema foi resolvido ontem, 18 de junho. Fiz o seguinte. Não tenho certeza de qual etapa funcionou.
www.satyabrata.com
A mensagem de aviso sobre URLs bloqueados desapareceu agora e um novo robots.txt é mostrado baixado nas Ferramentas do Google para webmasters.
Atualmente, tenho apenas duas páginas indexadas no Google, a home page e o robots.txt . Eu tenho 10 páginas no site. Espero que o resto seja indexado em breve.
fonte
Ocorreu um problema em que as imagens foram movidas para um servidor CNAME separado e uma proibição foi colocada na pasta de imagens. O que eu consegui esclarecer foi que o robots.txt recuperado nas Ferramentas do Google para webmasters leu a página da Web como ferramenta do Google. Depois que ele me disse que havia recuperado e lido o robots.txt, enviei-o. Isso quebrou um embargo de três meses na digitalização de imagens, onde o Google relatou que estava lendo o arquivo robots.txt, mas não estava alterando sua aparência para corresponder às regras que foram alteradas para permitir a pasta da imagem. Dentro de uma semana, as imagens estavam sendo indexadas novamente.
Pode valer a pena tentar. Sabe-se que o Google ocasionalmente fica preso e falha ao reler o arquivo.
fonte
Espero que este link o ajude a rastrear seus sites: https://support.google.com/adsense/answer/10532?hl=pt-BR .
Remova
/
do seu arquivo robots.txt .fonte
No meu caso, o problema era que eu estava usando um serviço DNS gratuito chamado fear.org.
(meu domínio gratuito terminou em
.us.to
)Depois da transição para um TLD, ele começou a funcionar.
fonte