Eu estava procurando hoje nas minhas ferramentas do Google para webmasters o meu site e vi títulos duplicados para as seguintes páginas no meu site (pequena amostra de muitos no índice do meu site):
/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business
Estas certamente não são páginas que eu criei!
Também vi meus dados estruturados que criei no meu site e posso ver isso (pequena amostra de muitas):
Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)
Nada disso é resultado de algo que eu fiz. Obviamente, é algum tipo de luto ou plano elaborado para roubar pagerank.
Ontem instalei o php automatizado 301 redirecionamentos e canônicos em todas as minhas páginas para tentar firmar isso (graças a alguma ajuda maravilhosa de pessoas com excesso de pilha). Mas eu gostaria de entender mais sobre isso e qual é o objetivo deles.
Respostas:
Algumas maneiras pelas quais páginas inexistentes acabam no Índice do Google
Existem três maneiras pelas quais páginas inexistentes podem acabar no Google ou em qualquer outro mecanismo de pesquisa, e são elas:
Suas páginas estão vinculadas a essas páginas. (Isso pode estar no mapa do site, em uma página de perfil, em um comentário do blog ou em um link baseado em href ...) Eu já vi alguns plugins do WordPress, por exemplo, que contêm esses links porque foram desenvolvidos em um site e depois enviados para a biblioteca de plug-ins, mas o desenvolvedor tem uma configuração de cache que se deparou com o plug-in.
Um backlink está apontando para essas páginas.
Vi páginas de índice e sequências de caracteres do Google que simplesmente não existem, embora as suas pareçam ter palavras que não vejo como o Googlebot poderia criar.
Links internos
Agora é provavelmente um tipo de link interno, porque pesquisei no Google suas páginas de título e encontrei apenas três páginas, o Pro Webmaster, outro site que cria imagens deste site e do seu. Parece que alguém criou este link ou um aplicativo / plugin / malware.
Investigando
Portanto, para descartar que seus usuários, você ou um aplicativo criaram esses links, o que você precisa fazer é fazer login no SQL (idealmente PHPMyadmin) e procurar as strings. Verifique se o banco de dados está limpo dessas páginas. você não obtém acertos na hora de pesquisar arquivos de cache e arquivos php para essas páginas. Se você não encontrar nada, é provável que alguém o tenha vinculado também, e agora não está no Google porque foi removido.
Redirecionar a
/?
String pode ser prejudicial se alguém quiserAgora eu posso ver que você removeu todas as
/?title=
strings e as redirecionou para a página inicial, embora isso seja uma coisa boa a se fazer, também pode ser prejudicial ao mesmo tempo e eu explicarei ..Se alguém estiver enviando spam para seu site com backlinks desagradáveis, a pior coisa a fazer é começar a redirecioná-lo para a página inicial, pois o Google pode ver isso como uma manipulação do pagerank. Isso ocorre porque o 301 redireciona o fluxo de suco a partir do link externo; se esse link acontecer, é um site do Viagra, você está dando uma indicação falsa ao Google no redirecionamento e isso pode voltar e morder você.
Tenho que amar os bons e velhos 404
A coisa certa a fazer em páginas que simplesmente não existem é usar um 404, isso é perfeitamente normal e de nenhuma maneira isso dá ao Google a impressão de que seu site está com problemas. Todas as páginas que não existem nunca terminarão no índice do Google e qualquer pessoa que faça um link com páginas inexistentes não deve prejudicar seu site se um 404 retornar, no entanto, como mencionado, um 301 para a home page 'MIGHT' porque está retendo o suco.
Há 1-2 anos, eu diria que o redirecionamento de strings era o melhor método, mas desde que o Panda e o Penguin atualizam, vi sites tentando de todo tipo tentar prejudicar a reputação online (basicamente o Panda, o Penguin pune sites por backlinks de spam, links pagos e, geralmente, links não relevantes) Embora o Google afirme que é impossível prejudicar a reputação de outras pessoas on-line, isso levanta a questão se isso é verdade, por que existem tantos outros atualmente enviando spam e como eles sabem que não é o webmaster tentando manipular seus próprios rankings? ? uma área discutível, mas vamos encerrar isso ... Eu acredito que um 404 será o mais adequado para você nesta situação.
A edição da consulta deve ser direta, em vez de redirecionar para
/
que a cadeia seja removida e 301 para/404/
.fonte