O que pode causar “Descoberto - atualmente não indexado” no novo GWT

18

O novo GWT mostra links de sitemaps divididos em novas categorias. Dois que me confundem: 1. Descoberto - atualmente não indexado 2. Rastreado - atualmente não indexado

Quais são as possíveis razões para isso e existem implicações em todo o site? É um sinal do Google que devo considerar removê-los?

insira a descrição da imagem aqui

Noam
fonte

Respostas:

11

É apenas parte do processo. Não há nada a fazer até você realmente receber erros .

Para entender as categorias, você precisa entender como a indexação funciona, algo que é feito praticamente de forma contínua:

  • O Googlebot busca uma página, o que significa baixar seu conteúdo nos servidores do Google. Quando isso acontece, a página é rastreada .
  • Posteriormente, coloca o conteúdo da página baixada no índice. Isso significa que a página está indexada .
  • Ao rastrear a página, ela encontra e as coloca em uma fila. Esses links são descobertos .

Então:

  • Descoberto não indexados meio do link foi adicionado à fila de coisas que Googlebot pode , eventualmente, crawl. Como a web é praticamente infinita e existe uma priorização, ela pode nunca chegar lá.
  • Rastreado atualmente não indexado significa que a página foi baixada nos servidores do Google, mas seu conteúdo não foi inserido no índice.
Itai
fonte
1
Eu acrescentaria que o Google decide o que rastrear com base no PageRank. Vincular à página com mais frequência ou destaque (mesmo internamente) pode fazer com que o Googlebot a rastreie.
Stephen Ostermiller
3
Eu acho que "atualmente não indexado" também pode significar que o Google está optando por não indexá-lo. Pode ser duplicado ou parecer de baixa qualidade. Pode não ter Pagerank suficiente. O Google pode pensar que não corresponderá a pesquisas suficientes.
Stephen Ostermiller
Isso é o que eu estava sugerindo com priorização . Isso acontece com links com suspeita de duplicação (às vezes porque diferem apenas em um parâmetro ou correspondem a outro canônico).
Itai
As páginas entram e saem de "Rastreado atualmente não indexado" sem nenhuma atenção minha. A informação também é duvidosa. Exemplo: um URL inspecionado resulta em uma mensagem indexada, mas não em nenhum sitemap ... a página está no sitemap e já existe há anos. A recente atualização de algo enviou este relatório para cá e para lá.
GLCoder #
3

O Google pode descobrir e rastrear suas páginas, mas isso não significa que necessariamente as indexará.

Há muitas razões pelas quais o Google pode não indexar uma página. Talvez tenha encontrado conteúdo duplicado. Talvez não pareça que ofereça valor suficiente para consultas de pesquisa específicas. O Google pode ter encontrado algo sobre a sua página que ela não gosta.

Qualquer que seja o motivo, o Google simplesmente não decidiu indexar algumas das páginas descobertas e rastreadas no seu site. É bastante normal que algumas de suas páginas não sejam indexadas. Algumas das páginas dos meus sites não são indexadas, apesar de ter um conteúdo melhor do que muitas páginas indexadas e uma quantidade substancial de links internos. O sistema de indexação do Google é um algoritmo de aprendizado de máquina. Por isso, pode optar por não indexar algumas páginas algumas vezes por vários motivos desconhecidos.

Michael d
fonte
1
"Talvez tenha encontrado conteúdo duplicado"> Gostaria de acrescentar que, neste caso, como a mensagem é "Descoberta - atualmente não indexada", indica que a página nem sequer foi buscada (ou seria "Rastreada" - atualmente não indexado "). Portanto, neste momento, eles não sabem nada sobre o seu conteúdo. Então, acho que a priorização nesse estágio depende do próprio URL, do número de páginas vinculadas a ele e de outras coisas.
Niavlys 01/12
2

O Googlebot tem sua própria fila, com base em diferentes parâmetros. Essa é a mensagem sobre esses URLs que estão na fila.

insira a descrição da imagem aqui

Aj Cohn tem uma opinião engraçada sobre o significado desta mensagem:

Descoberto - atualmente não indexado, parece indicar que eles o veem no mapa do site, mas com base na aparência de outro conteúdo, eles nem sequer se incomodarão em rastrear. Essencialmente, “Ya feio!” Ou talvez seja apenas uma representação da baixa eficiência do rastreamento.

Francamente, não tenho certeza absoluta de que a definição de Descoberto seja precisa, pois muitos dos URLs de exemplo nesse status têm uma data do último rastreamento. Isso parece contradizer a definição fornecida.

Evgeniy
fonte
2
Eu removi o bit "leia o manual". Isso não ajuda. Especialmente porque a documentação do Google é muito ruim.
Stephen Ostermiller
0

Embora o Google tenha descoberto o URL, ele não considerou importante o suficiente para gastar tempo rastreando. Se você deseja que esta página receba tráfego de pesquisa orgânica, considere vincular mais a ela no seu próprio site. Certifique-se de promover esse conteúdo para outras pessoas com a esperança de obter backlinks de sites externos. Links externos para o seu conteúdo são um sinal para o Google de que uma página é valiosa e considerada confiável, o que aumenta as chances de ela ser indexada.

tsogtgerel.ts
fonte