Recentemente, notei que tenho uma lista crescente de erros do Soft 404 nas Ferramentas do Google para webmasters. Eles são todos para páginas de resultados de pesquisa geradas dinamicamente que relatam "Nenhuma correspondência encontrada".
Eu não entendo o que o Google quer dizer com suave 404 e por que eles estão relatando que para estas páginas. Então eu adicionei <meta name="robots" content="noindex">
a estas páginas.
No entanto, o Google ainda está relatando novos erros do Soft 404 para páginas que usam a metatag noindex .
Por que o Google relata algum erro para uma página que eu disse a eles para não indexar?
O problema é que, com todos esses erros indesejados, não consigo ver se existem problemas reais que precisam ser corrigidos.
Alguns disseram que essas páginas devem retornar um código de status 404. Mas isso apenas muda o problema para a guia erros 404. Além disso, o Google retorna o código de status 200 para a página sem resultados .
Não quero bloquear o acesso ao robots.txt porque quero que os links dessas páginas sejam seguidos e que o Google veja a metatag noindex . Além disso, não existe um padrão que eu possa usar para bloqueá-los.
O Google encontrou esses URLs em primeiro lugar porque o conteúdo existia, mas foi excluído. Não consigo retornar um código de status 410, porque meu código PHP não tem como saber o motivo pelo qual nenhum resultado foi encontrado.
Há algo que eu possa fazer para facilitar a visualização dos problemas reais?
fonte
Respostas:
Você deve impedir o Google de rastrear páginas de pesquisa no site. O Google não deseja rastrear sua pesquisa no site . Aqui está a postagem no blog de Matt Cutts do Google sobre o problema: Resultados da pesquisa nos resultados de pesquisa de Matt Cutts em 10 de março de 2007 . O Google agora penaliza ativamente sites que permitem que seus resultados de pesquisa sejam rastreados e apareçam nos SERPs do Google. Ao permitir que o Googlebot rastreie suas páginas de resultados de pesquisa, você está arriscando todo o seu tráfego de referência do Google. Um truque favorito de um revisor do Google é usar a pesquisa no site para termos de spam como "Viagra". Quando virem uma página rastreável como resultado (mesmo que não seja encontrado nenhum resultado para o Viagra), eles aplicarão uma penalidade manual contra o seu site como spam.
Você deve colocar sua pesquisa no site
robots.txt
. Apenas verifique se o Googlebot ainda pode rastrear suas páginas de conteúdo. Você irá parar de receber novos erros 404 soft relatados.Um grande número de erros 404 (mesmo erros leves 404) não prejudica a classificação do seu site. O Google relata erros em qualquer página que eles possam encontrar e rastrear, se você deseja ou não indexá-lo e se você vincula ou não a ele. Eles fazem isso porque os relatórios de erro são exclusivamente para seu benefício e consideram que você deve ser totalmente informado.
Aqui está o que John Mueller, do Google, tem a dizer sobre isso :
fonte