Luto por roubar pagerank do meu site?

8

Eu estava procurando hoje nas minhas ferramentas do Google para webmasters o meu site e vi títulos duplicados para as seguintes páginas no meu site (pequena amostra de muitos no índice do meu site):

/?title=3_Misconceptions_Regarding_Traumatic_Human_brain_Injury365
/?title=3_or_more_Misguided_beliefs_Pertaining_to_Disturbing_Head_Incidents2902384
/?title=A_Listing_Of_Successful_Web_Marketing_Tips_For_EveryoneHelpful_Online_Marketing_Methods_For_Easy_Success
/?title=Adhere_to_This_kind_of_Online_marketing_Guidance_To_develop_Your_Business

Estas certamente não são páginas que eu criei!

Também vi meus dados estruturados que criei no meu site e posso ver isso (pequena amostra de muitas):

Structured Data > __sid=11 (Markup: kualalumpur.yalwa.my)
Structured Data > __sid=7 (Markup: www.locanto.cn)

Nada disso é resultado de algo que eu fiz. Obviamente, é algum tipo de luto ou plano elaborado para roubar pagerank.

Ontem instalei o php automatizado 301 redirecionamentos e canônicos em todas as minhas páginas para tentar firmar isso (graças a alguma ajuda maravilhosa de pessoas com excesso de pilha). Mas eu gostaria de entender mais sobre isso e qual é o objetivo deles.

Amy Neville
fonte
11
Mesmo que você não tenha criado os títulos das páginas, essas páginas são algo que você criou? você permite que as pessoas criem páginas no seu site e assim por diante? Conte-nos mais sobre o site em questão, já que, no momento, é um palpite. Pode ser malware, pode ser o seu sistema de gerenciamento de conteúdo, oferecendo vários URLs com títulos diferentes, podem ser pessoas tentando prejudicar sua reputação (mente duvidosa). Edite sua pergunta e nos dê uma idéia melhor do site que você administra, com os pontos-chave que mencionei, também um URL para o site em questão é importante para esses tópicos.
Simon Hayter
Estas não são as páginas que eu criei. Notei no entanto, que com o meu wiki que theres uma determinada página para representar páginas incriadas e não 404 erro é servido
Amy Neville
O material de dados estruturados é totalmente estranho, mas eu simplesmente não entendo de onde isso pode vir.
Amy Neville
11
Oi Amy, pense I gotcha e apesar de alguns trabalhos de investigação Eu acho que tenho uma resposta para você, embora você não pode gostar dele;)
Simon Hayter
11
Olá, trabalho com a equipe das Ferramentas do Google para webmasters. Esse foi um problema do nosso lado que afetou apenas a ferramenta Teste de dados estruturados e o painel apropriado nas Ferramentas do Google para webmasters. Isso não afetou a pesquisa na web, e isso provavelmente não foi realmente algo encontrado em seu site. Desculpe pela confusão!
John Mueller

Respostas:

6

Algumas maneiras pelas quais páginas inexistentes acabam no Índice do Google

Existem três maneiras pelas quais páginas inexistentes podem acabar no Google ou em qualquer outro mecanismo de pesquisa, e são elas:

  • Suas páginas estão vinculadas a essas páginas. (Isso pode estar no mapa do site, em uma página de perfil, em um comentário do blog ou em um link baseado em href ...) Eu já vi alguns plugins do WordPress, por exemplo, que contêm esses links porque foram desenvolvidos em um site e depois enviados para a biblioteca de plug-ins, mas o desenvolvedor tem uma configuração de cache que se deparou com o plug-in.

  • Um backlink está apontando para essas páginas.

  • Vi páginas de índice e sequências de caracteres do Google que simplesmente não existem, embora as suas pareçam ter palavras que não vejo como o Googlebot poderia criar.

Links internos

Agora é provavelmente um tipo de link interno, porque pesquisei no Google suas páginas de título e encontrei apenas três páginas, o Pro Webmaster, outro site que cria imagens deste site e do seu. Parece que alguém criou este link ou um aplicativo / plugin / malware.

Investigando

Portanto, para descartar que seus usuários, você ou um aplicativo criaram esses links, o que você precisa fazer é fazer login no SQL (idealmente PHPMyadmin) e procurar as strings. Verifique se o banco de dados está limpo dessas páginas. você não obtém acertos na hora de pesquisar arquivos de cache e arquivos php para essas páginas. Se você não encontrar nada, é provável que alguém o tenha vinculado também, e agora não está no Google porque foi removido.

Redirecionar a /?String pode ser prejudicial se alguém quiser

Agora eu posso ver que você removeu todas as /?title=strings e as redirecionou para a página inicial, embora isso seja uma coisa boa a se fazer, também pode ser prejudicial ao mesmo tempo e eu explicarei ..

Se alguém estiver enviando spam para seu site com backlinks desagradáveis, a pior coisa a fazer é começar a redirecioná-lo para a página inicial, pois o Google pode ver isso como uma manipulação do pagerank. Isso ocorre porque o 301 redireciona o fluxo de suco a partir do link externo; se esse link acontecer, é um site do Viagra, você está dando uma indicação falsa ao Google no redirecionamento e isso pode voltar e morder você.

Tenho que amar os bons e velhos 404

A coisa certa a fazer em páginas que simplesmente não existem é usar um 404, isso é perfeitamente normal e de nenhuma maneira isso dá ao Google a impressão de que seu site está com problemas. Todas as páginas que não existem nunca terminarão no índice do Google e qualquer pessoa que faça um link com páginas inexistentes não deve prejudicar seu site se um 404 retornar, no entanto, como mencionado, um 301 para a home page 'MIGHT' porque está retendo o suco.

Há 1-2 anos, eu diria que o redirecionamento de strings era o melhor método, mas desde que o Panda e o Penguin atualizam, vi sites tentando de todo tipo tentar prejudicar a reputação online (basicamente o Panda, o Penguin pune sites por backlinks de spam, links pagos e, geralmente, links não relevantes) Embora o Google afirme que é impossível prejudicar a reputação de outras pessoas on-line, isso levanta a questão se isso é verdade, por que existem tantos outros atualmente enviando spam e como eles sabem que não é o webmaster tentando manipular seus próprios rankings? ? uma área discutível, mas vamos encerrar isso ... Eu acredito que um 404 será o mais adequado para você nesta situação.

A edição da consulta deve ser direta, em vez de redirecionar para /que a cadeia seja removida e 301 para /404/.

Simon Hayter
fonte
não me deixa votar-se, mas isso é uma grande resposta graças
Amy Neville
Não tem problema nenhum, agora pegue Lucky Charms em todos os seus outdoors;)
Simon Hayter
@SimonHayter o Google capta a resposta HTTP 404 e ignora o conteúdo da página? O que você acha de uma página 404 que um javascript redireciona para a página inicial? Apenas curioso das implicações
Jonathan