Por que os mecanismos de pesquisa não estão indexando meu conteúdo?

29

Este é um par geral de perguntas e respostas gerais do wiki da comunidade, destinado a abordar quaisquer questões relacionadas aos motivos pelos quais um site ou conteúdo específico não aparece nos resultados dos mecanismos de pesquisa.

Se sua pergunta foi encerrada como uma duplicata e você acha que as informações fornecidas aqui não fornecem uma resposta suficiente, abra uma discussão no Pro Webmasters Meta .

Meu site (ou páginas específicas no meu site) não está aparecendo nos resultados do mecanismo de pesquisa.

Por que meu conteúdo não está indexado e o que posso fazer?

danlefree
fonte

Respostas:

36

Há vários motivos pelos quais seu conteúdo pode não aparecer nos resultados dos mecanismos de pesquisa. No entanto, é importante observar que o índice de um mecanismo de pesquisa pode conter páginas que não são exibidas em sua página de resultados .

Como saber se seu conteúdo está realmente indexado

Pode ser difícil saber se o seu conteúdo está indexado.

  • Pesquise todos os documentos do seu site e veja quantos estão listados
    • Google: enter site:example.com(onde example.comestá o seu domínio, não deve haver espaço após os dois pontos).
    • Bing: digitesite: example.com
    • Yahoo: insira site: example.com(ou use o formulário de pesquisa avançada)
  • Procure um documento específico por uma frase única de oito a doze palavras e pesquise essa frase entre aspas. Por exemplo, para encontrar este documento, você pode optar por pesquisar por "número de razões pelas quais seu conteúdo pode não aparecer nos resultados do mecanismo de pesquisa"
  • Além do acima, pesquise por palavras-chave usando inurl:e intitle:você pode tentar algo como: keyword with another keyword inurl:example.comisso exibirá páginas indexadas apenas para o domínio especificado.

    • Entre nas ferramentas do webmaster para ver estatísticas do próprio mecanismo de pesquisa sobre quantas páginas são indexadas no site
    • Ferramentas para webmasters do Google - As informações estão disponíveis em "Saúde" »" Status do índice ". Se você enviou mapas do site, também pode ver quantos documentos em cada arquivo de mapa do site foram indexados.
    • Ferramentas para webmasters do Bing

Em alguns casos, os documentos podem não parecer indexados por um desses métodos, mas os documentos podem ser encontrados no índice usando outros métodos. Por exemplo, as ferramentas para webmasters podem relatar que poucos documentos são indexados, mesmo quando você pode procurar por suas frases e encontrar os documentos no mecanismo de pesquisa. Nesse caso, os documentos são realmente indexados.

Como o conteúdo se torna indexado

Antes de os mecanismos de pesquisa indexarem o conteúdo, eles devem encontrá-lo usando um rastreador da web. Você deve verificar os logs do servidor da web para ver se os rastreadores dos mecanismos de pesquisa (identificados pelo agente do usuário - por exemplo , Googlebot , Bing / MSNbot ) estão visitando seu site.

Mecanismos de pesquisa maiores, como Google e Bing, costumam rastrear sites com frequência, mas o rastreador pode não conhecer novos sites. Você pode notificar os mecanismos de pesquisa sobre a existência do seu site registrando-se como seu webmaster ( Ferramentas para webmasters do Google , Ferramentas para webmasters do Bing ) ou, se o mecanismo de pesquisa não fornecer esse recurso, enviando um link para seus rastreadores (por exemplo, Yahoo ).

Há quanto tempo seu site / conteúdo está online?

Os mecanismos de pesquisa podem indexar o conteúdo muito rapidamente depois que ele foi encontrado; no entanto, essas atualizações são ocasionalmente atrasadas. Motores de busca menores também podem ser muito menos responsivos e levar semanas para indexar novos conteúdos.

Se o seu conteúdo estiver online apenas por vários dias e não possuir links de outros sites (ou os links vierem de sites que os rastreadores não visitam com frequência), provavelmente não está indexado. Se seu site não estiver ativo há mais de alguns meses, os mecanismos de pesquisa podem não confiar nele o suficiente para indexar muito conteúdo ainda.

O conteúdo foi excluído pelo webmaster?

Esta etapa é especialmente importante se você estiver assumindo o controle de um site de outra pessoa e houver um problema com uma página ou diretório específico: verifique as exclusões dos robôs robots.txt e META e remova-as se desejar que os rastreadores indexem o conteúdo que está sendo excluído.

Existe um problema técnico que impede que seu conteúdo seja indexado?

Se você possui um site estabelecido, mas o conteúdo específico não está sendo indexado (não há hits do rastreador da Web nos URLs em que o conteúdo reside), as ferramentas para webmasters fornecidas pelo Google e Bing podem fornecer informações úteis sobre diagnóstico.

A documentação de Erros de rastreamento do Google fornece um amplo histórico de problemas comuns para os rastreadores da Web que impedem a indexação de conteúdo e, se você usar as Ferramentas do Google para webmasters, receberá um alerta se algum desses problemas for detectado em seu site.

Corrija erros e configurações incorretas o mais rápido possível para garantir que todo o conteúdo do seu site seja indexado.

O conteúdo é de baixa qualidade?

Os mecanismos de pesquisa não indexam a maioria das páginas que rastreiam. Eles indexam apenas o conteúdo da mais alta qualidade. Os mecanismos de pesquisa não indexarão o conteúdo se:

  • É spam, sem sentido ou bobagem.
  • Pode ser encontrada em outro lugar. Quando os mecanismos de pesquisa encontram conteúdo duplicado, eles escolhem apenas uma das duplicatas para indexar. Geralmente esse é o original que tem mais reputação e links.
  • É magro. Precisa de mais do que algumas linhas de texto original. De preferência muito mais. As páginas criadas automaticamente com pouco conteúdo, como uma página para cada um de seus usuários, dificilmente serão indexadas.
  • Não possui reputação ou links suficientes. Uma página pode estar muito enterrada no seu site para ser classificada. É improvável que qualquer página sem links externos e mais de alguns cliques na página inicial seja indexada.

Algum do seu conteúdo está indexado, mas não todo?

Se seu site tiver centenas de páginas, o Google quase nunca escolherá indexar todas as páginas. Se seu site possui dezenas de milhares de páginas, é muito comum o Google optar por indexar apenas uma pequena parte dessas páginas.

O Google escolhe o número de páginas para indexar em um site com base na reputação geral do site e na qualidade do conteúdo. O Google normalmente indexa uma porcentagem maior de um site ao longo do tempo, à medida que a reputação do site aumenta.

Stephen Ostermiller
fonte
1

Eu acho que não preciso repetir a mesma coisa como mencionado acima, no entanto, se você não estiver familiarizado com a nova ferramenta, aqui está a maneira de verificá-la abaixo.

Você pode verificar se o arquivo robot.txt não está bloqueando o conteúdo acessando a Ferramenta Tester robots.txt do antigo webmaster do Google

insira a descrição da imagem aqui

Google Search Console (nova versão)

O console de pesquisa do Google fornece informações valiosas que a versão anterior. Verifique os problemas diretamente no Console de Pesquisa do Google, se sua página está rastreada ou não, indexada ou não, ativa ou não e os problemas, se houver.

  1. Faça login no Google Search Console do seu site
  2. Se você possui várias propriedades de domínio, verifique se selecionou a desejada.

Ferramenta preterida no Google Webmaster

Isso está desatualizado agora

É assim que você pode acessar o novo Search Console

Novo console de pesquisa do Google

Deepak Mathur
fonte
0

Se você tiver um arquivo robots.txt em seu diretório raiz, pode ser que o Google não indexe seu site.

Você já verificou isso?

Geralmente é seguro excluir (ou renomear) esses arquivos, pois parece que você deseja ser indexado.

IMPORTANTE: isso pode ser um fator decisivo se você estiver tentando fazer com que o Google Adsense funcione em seu site.

Não importa onde você coloque seu código especial, se você não estiver sendo indexado, você será avisado de que seu site está inativo para que eles não possam verificá-lo.

SDsolar
fonte
O arquivo robots.txt possui um conjunto de regras definidas pelo usuário para rastrear ou não; portanto, removê-lo não é uma solução, pois é o primeiro arquivo a ser rastreado. A melhor solução é corrigir as regras, testar o arquivo robots.txt e adicionar a diretiva sitemap em seu robot.txt. Mantenha seu sitemap atualizado com lastmod e altere os atributos de frequência.
Deepak Mathur