Minha esposa trabalha em uma escola na Alemanha. Recentemente, notei que é extremamente difícil encontrar a página inicial dessa escola usando o Google. Eu olhei o código fonte da página e acredito que encontrei o motivo: existem duas <meta name="robots">
tags; um é
<meta name="robots" content="all">
e o segundo, mais abaixo na página, é
<meta name="robots" content="noindex, follow">
Meu palpite é que o segundo supera o primeiro e impede o Google de indexar o site. Estou certo? Eu não gostaria de dizer ao webmaster que eu encontrei o problema e me fazer de idiota (porque eu realmente não sei nada sobre como criar uma página da web adequada, muito menos fazer SEO).
A propósito, se você encontrar outras bobagens no site, ficaria feliz em poder denunciá-las. Meu próximo candidato seria a total falta de meta
tags relevantes que transmitam informações sobre o conteúdo da página.
fonte
<meta name="robots" content="all">
é semanticamente igual a<meta name="robots" content="index, follow">
, portanto as duas metatags estão contraditórias de qualquer maneira. Eu iria notificar o webmaster. Também acho que o Google escolherá a política mais rígida e, portanto, não indexará a página para evitar problemas de direitos autorais.ajax.googleapis.com
essl.google-analytics.com
). Essa pode ser uma questão legal contra o privilégio da autodeterminação informacional na Alemanha. Eu recomendaria evitar isso.title
elementos. E o mesmo se repete em outras páginas, não apenas na página inicial! De fato, não parece haver nenhuma página indexada, além de um punhado de PDFs !? Módulos conflitantes no CMS, talvez ?! Problema secundário ... Conforme declarado nas respostas, a regra mais restritiva será aplicada pelos mecanismos de busca - não necessariamente a regra posterior. No entanto, uma função como a do PHPget_meta_tags()
retornará apenas a regra posterior - portanto, há um problema (potencial) imediato em ter várias metatags para os mesmos dados.Respostas:
Enquanto a Wikipedia alemã afirma que
all
é um valor válido, não tenho idéia de onde essas informações vêm, e a Wikipedia alemã não cita nenhuma fonte. É AFAIK errado, e IMHO é um bom exemplo de por que não se deve confiar na Wikipedia para esse tipo de informação.Se você deseja usar a metatag do robô para direcionar o googlebot , a melhor informação sobre valores válidos é a central de webmasters do Google . Ele lista os seis seguintes valores como válido:
noindex, nofollow, noarchive, nosnippet, noodp, none
.Em outras palavras, para o googlebot :
é um erro de sintaxe e será ignorado, enquanto:
é uma sintaxe válida e será obedecida (por isso, é extremamente difícil encontrar a página inicial dessa escola usando o Google).
Para responder à sua segunda pergunta, o que acontece se duas metatags de robôs válidas entrarem em conflito, o Google diz (mesma página que a vinculada acima):
Quanto às metatags, aqui está uma visão geral das metatags reconhecidas pelo Google .
fonte
O comportamento de duas metatags conflitantes não está definido, até onde eu sei, mas provavelmente a regra mais restritiva vencerá.
Isso acontece no caso semelhante da tag arquivo robots.txt vs meta robots. Se o robots.txt impedir a indexação de uma página e os meta-robôs não, a página não será indexada. E se o robots.txt permite uma página, mas os meta-robôs a bloqueiam, ela ainda não será indexada.
Portanto, a lógica ditaria que, se houver duas metatags conflitantes, se uma bloquear a indexação, ela substituirá a outra (independentemente de seus respectivos locais na página).
Você deve perguntar ao webmaster se eles estão bloqueando os mecanismos de pesquisa por um motivo específico. Caso contrário, remova as duas metatags (o padrão é permitir que os mecanismos de pesquisa não tenham razão para ter a tag).
Quanto à outra parte da sua pergunta, as análises de sites estão fora do escopo dos Pro Webmasters. Mas vou acrescentar que a tag meta description é provavelmente a única que você achará útil. A tag meta keywords não é usada por nenhum mecanismo de pesquisa.
fonte