Número de páginas indexadas com pesquisa "site:" menor que o relatado nas Ferramentas do Google para webmasters

13

Nas ferramentas para webmasters do Google, mostra que tenho 309 páginas indexadas, mas quando pesquiso usando "site: site.com" aparecem apenas cerca de 180 (na primeira página aparecem "cerca de 608 resultados", algo próximo ao número total de postagens).

Também notei que algumas páginas que foram indexadas antes simplesmente desapareceram do Google. Nas ferramentas para webmasters do Google, não há mensagem de erro nem nada que indique punição por parte do Google.

De acordo com as ferramentas do Google para webmasters, as novas páginas diárias são indexadas, mas por algum motivo elas não são exibidas na pesquisa.

Sou realmente afetado por alguma punição do Google ou isso é algum tipo de bug? Como posso resolver esse problema e ter todas as páginas indexadas normalmente?

FPSxploit
fonte

Respostas:

7

Você não tem um problema de indexação. O Google Webmasters Tools é a fonte autorizada de informações sobre seu site com o Google. Tudo o que diz que é verdade. Os operadores gostam site:e link:são conhecidos por não mostrar todos os resultados relevantes. Isso é intencional, pois impede que outras pessoas saibam exatamente o que o Google está lidando com seu site inibe qualquer tentativa de manipular os resultados da pesquisa por outras pessoas.

John Conde
fonte
4
Você tem alguma referência a esta reivindicação?
Al-Punk
6

Você postou esta pergunta de maneira diferente duas vezes. Esta resposta foi para a pergunta marcada como duplicada, que agora posto aqui esperando ajudá-lo. Embora as duas perguntas possam não ser exatamente iguais, essa resposta é uma resposta à pergunta marcada como duplicada. Por favor, lembre-se disso.

Você tem três coisas acontecendo aqui e há pouca ou nenhuma conexão entre elas. Eu vou explicar

1] No Google Search Console (Ferramentas para webmasters), Índice do Google> Status do índice, o número é o número real de páginas que o Google indexou em um site específico. Este é um número factual.

2] No Google Search Console (Ferramentas para webmasters), Rastrear> Sitemaps, o número é o número de páginas encontradas no mapa do site que são indexadas quando atualizadas pela última vez. Saiba que isso não é em tempo real nem mesmo próximo. Baseia-se em auditorias do mapa do site, que ocorrem periodicamente e em curto espaço de tempo. Por esse motivo, é uma métrica enganosa que deve ser explicada, mas não é. Esse número raramente concorda com o número descrito no item 1.

3] "Sobre nnn resultados" é o número de páginas no conjunto de resultados da consulta do índice que passa por todos os "filtros" SERP. Quando uma consulta de pesquisa é enviada, os conjuntos de resultados (na verdade existem várias consultas) são combinados e, em seguida, enviados a filtros que fazem várias coisas, como classificar os resultados e é onde as penalidades SERP (as menos severas das duas) são aplicadas. Esse número raramente concorda com o número descrito no item 1.

Das três, se você quiser saber o número de páginas que um site indexou, a opção 1 é a melhor. Se você deseja saber o número de páginas que um site indexou que atualmente passa nos filtros, escolha a opção 3 com um site: a pesquisa é a melhor. A opção 3 deve ser quase totalmente ignorada, a menos que você esteja vendo esse número com frequência suficiente para ter uma ideia sólida das coisas. Para um novo site, em particular, isso pode ser uma métrica decepcionante simplesmente porque nem todas as métricas de classificação para as páginas indexadas ainda são calculadas.

Qualquer site novo e com apenas 2 meses de idade é extremamente novo, não se preocupe muito com nenhuma das métricas. A razão para isso é simples. Demora quase um ano para um site se instalar completamente nos SERPs. Parte desse processo é avaliar métricas como taxa de cliques (CTR), taxa de rejeição, tempo gasto na página, tempo gasto no site, etc. Acrescente a isso todas as principais atualizações que o Google fez desde março, onde o Panda, em particular , ainda está em andamento e entrará no próximo ano. Com toda essa interrupção do algoritmo principal, a adição do RankBrain e do Panda, qualquer site verá flutuações, algumas possivelmente severas às vezes, o que torna quase impossível que alguém avalie onde o site realmente está por algum tempo.

Aconselho trabalhar no seu site, tornando-o o melhor possível e mantendo a cabeça baixa por um tempo. Ainda não entre nas ervas daninhas métricas. Não pagaria dividendos.

closetnoc
fonte
Espere o que? Como um mecanismo de pesquisa pode saber sobre sua taxa de rejeição? A menos que eles compartilhem dados do Google Analytics (o que eles não deveriam), não há como eles saberem se alguém que eles enviaram para uma de suas páginas acabou de fechar essa guia ou continuar por horas ... A única coisa que eles sabem é se o usuário tentou o segundo, terceiro, etc. resultados e deduz que esse primeiro resultado não foi bem adaptado ("porcaria").
Alexis Wilke
@AlexisWilke A taxa de rejeição que você vê no console de pesquisa é o que o Google sabe sem análises. Isso se baseia apenas na taxa de rejeição dos resultados de pesquisa (SERPs). O GA conhece uma taxa de rejeição diferente porque você está executando o erro. Duas coisas completamente diferentes. O que conta para a classificação é a taxa de rejeição vista no console de pesquisa. Felicidades!!
closetnoc
Essa e a coisa. Eu vejo quatro parâmetros no meu console de Pesquisa do Google: Cliques, Impressões, CTR e Posição. Não há estatísticas de rejeição. Realmente não vejo como eles poderiam saber que um clique retornou da Pesquisa Google.
Alexis Wilke
1
@AlexisWilke É simples clicar em um link SERP e retornar aos SERPs. Isso é um salto para o Google. Google, o mecanismo de pesquisa não usa métricas do GA. O motivo é simples. Para usar o AI, não pode haver nenhuma métrica ausente para o conjunto de dados ou a métrica não faz sentido. Como a maioria dos sites não possui o GA, essas métricas não podem ser usadas para classificação. Os resultados seriam distorcidos.
closetnoc
5

Também pode ser filtros de conteúdo duplicados. Faça uma pesquisa no site e vá para a última página dos resultados da pesquisa. Pode ser a página 30 ou mais. Na parte inferior da última página, você verá algo semelhante a este:

Para mostrar os resultados mais relevantes, omitimos algumas entradas muito semelhantes às 348 já exibidas. Se desejar, você pode repetir a pesquisa com os resultados omitidos incluídos.

Ao clicar no repeat the search with the omitted results includedlink, você verá mais resultados listados em todas as páginas. Os resultados podem ser ocultados, até os resultados na página 1. Isso os expõe.

dhaupin
fonte
Bom ponto! Eu esqueci disso isso.
closetnoc