O Google rastreia sites Drupal no modo de manutenção?

10

Estou usando o Aegir para clonar cópias do meu site com um nome de subdomínio, como test.mydomain.com. Essas cópias estão no modo de manutenção para evitar spammers e olhares indiscretos. Depois, uso essas cópias para realizar testes e trabalhos de desenvolvimento antes de fazer alterações no meu site principal mydomain.com

Mas estou prejudicando meu SEO pela existência desses sites clonados? O Google rastreia sites que foram colocados no modo de manutenção? Isso vai me penalizar por ter tantos subdomínios sem saída?

Meggy
fonte
3
Essa pergunta parece fora de tópico porque se trata de algoritmos internos do Google, não de algo especificamente relacionado ao Drupal, nem de algo que possamos conhecer com um nível significativo de confiança.
Mołot
7
@ Mołot Como isso pode não estar no tópico? O modo de manutenção é um recurso do Drupal. Existem métodos para lidar adequadamente com esse cenário. Perguntar se o Drupal faz a coisa certa é útil para futuros leitores.
mpdonadio
2
@MPD pelo menos a parte "Será que me penalizará por ter tantos subdomínios sem saída" é totalmente Drupal não relacionado. As maneiras pelas quais o Google pode ser direcionado para uma página no modo de manutenção também não são relacionadas ao Drupal.
Mołot

Respostas:

21

Quando você coloca um site Drupal no modo de manutenção, os não administradores veem a página do modo de manutenção padrão (supondo que você limpe os caches depois de fazer isso). Se você examinar a resposta, verá que ela é enviada de volta com um código de status HTTP 503, que da RFC 2616 é:

503 Serviço indisponível.
No momento, o servidor não pode lidar com a solicitação devido a uma sobrecarga ou manutenção temporária do servidor. A implicação é que esta é uma condição temporária que será aliviada após algum atraso. Se conhecido, o comprimento do atraso pode ser indicado em um cabeçalho de repetição após. Se nenhuma nova tentativa após é dada, o cliente deve lidar com a resposta como faria para uma resposta de 500.

E no blog oficial do Google para webmasters :

Se meu site estiver desativado para manutenção, como posso solicitar ao Googlebot que volte mais tarde, em vez de indexar a página "desativado para manutenção"?
Você deve configurar seu servidor para retornar um status 503 (rede indisponível) em vez de 200 (bem-sucedido). Isso permite ao Googlebot tentar as páginas novamente mais tarde.

Portanto, isso evidencia que o Drupal faz a coisa certa e que o Google revisitará seu site e indexará as páginas na próxima vez em que receber um código de status não 5XX.

mpdonadio
fonte
2
A página de login do usuário continuará retornando um código de status 200 OK (e também exibirá os blocos que normalmente não são visíveis no modo de manutenção ( # 722434 )); no entanto, o robots.txt possui uma diretiva Disallow: para a página de login, portanto, os bots bem-comportados ainda não a indexarão.
precisa
Este é um bom ponto em relação à própria página de manutenção. O código de resposta 503 significa que o Google não indexará essa página de manutenção.
David Thomas
6

A menos que você tenha feito algo personalizado para permitir isso, o Google não pode rastrear seu site no modo de manutenção.

Como você precisa fazer login para visualizar, o googlebot verá a página de manutenção designada.

Para diretrizes adicionais do Google, consulte os seguintes links:

David Thomas
fonte
Acho que o ponto era que você não gostaria que o Google indexasse a página de manutenção.
Fuzzy76
2

Suas preocupações:

Se você não sabe se o modo de manutenção está bloqueando "tudo o que você deseja bloquear" em 100% (!) - mas ao mesmo tempo está muito preocupado com "se alguém como o Google ainda pode acessá-lo". ... o modo de manutenção pode ser uma má escolha para bloquear o site de desenvolvimento em primeiro lugar.

Recomendação:

Pessoalmente, recomendo simplesmente adicionar um .htpasswd aos seus sites de desenvolvimento.

É simples automatizar mesmo dentro de implantações de aegir. Ele nunca fica no seu caminho, porque seu navegador e todas as ferramentas de linha de comando podem ignorá-lo. Você pode permitir que outras pessoas entrem. Ele bloqueia o site com 100% de integridade para o Google etc.

user18099
fonte