WordPress com SOFT 404 no Google Search Console (WMT) O que causa Q82019309.com?

8

Meu site de irmãos que eu projetei para ele por algum tempo tem centenas de SOFT 404 relatadas no Search Console do Google, anteriormente Ferramentas do Google para webmasters. Geralmente acho fácil consertar o soft 404, mas isso me deixa um pouco perplexo. Todos os erros de software estão retornando uma sequência ímpar que contém Q82019309.comuma subpasta ocasional Aristocratdentro da sequência /?=.

Os 404 geralmente se parecem com:

  • Codificado: /search/%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Decodificado: /search/大奖总代Q82019309.com

O link das informações fornece:

  • Codificado: /?s=%E5%A4%A7%E5%A5%96%E6%80%BB%E4%BB%A3Q82019309.com
  • Decodificado: /?s=大奖总代Q82019309.com

No começo, eu acreditava que era um problema isolado, mas, ao investigar, descobri que esse problema realmente afeta milhares de sites e alguém deve saber a causa. Quando eu Google Q82019309.com WordPress ou Aristocrat Q82019309.com , fico impressionado com a quantidade de resultados, incluindo alguns sites de alta reputação, como:

Questões):

Então, o que está causando esses erros 404 suaves com string Q82019309.comcom ou sem Aristocrat.

Simon Hayter
fonte
Seu site foi invadido. Q82019309.com está comprometido.
precisa saber é o seguinte
Ir ao site Q82019309.com diz que é um site de ataque e eu concordo que é desonesto, mas acho difícil acreditar que todos esses sites foram invadidos por algo que usa uma string de consulta na pesquisa. Existem centenas de milhares de sites literários que estão relatando Q82019309.com ... sites de alta reputação ... certamente esses nem todos são invadidos?
Simon Hayter
Os links parecem ser todos com spam. Um perfil muito típico. Além disso, isso parece ser específico para sites WP. Isso parece ser bastante recente, em apenas alguns dias (quatro ou mais). Verifique a instalação do WP para garantir que tudo esteja atualizado. Veja: web.nvd.nist.gov/view/vuln/…
closetnoc
Foi descoberto há mais de uma semana 13 anos.
Simon Hayter
Acho que vou ter que examinar os erros.log e access.logs para identificar se alguém tentou ou entrou através de um novo hack.
Simon Hayter

Respostas:

2

Estávamos tendo o mesmo problema no wisepops.com desde 3 de janeiro de 2017.

O Google está reclamando do Soft 404, mesmo se a indexação estiver desativada nessas páginas. A página de pesquisa do Wordpress tem por padrão esta meta:

<meta name="robots" content="noindex,follow">

Decidi fazer com que as páginas de pesquisa sem resultados retornassem um código HTTP 404. Como a consulta de pesquisa está no URL, é bom lidar com isso dessa maneira.

Para o Wordpress, adicionei no final das funções do meu tema.php:

/*---------------------------------------------------*/
/*  SEARCH PAGES WITHOUT RESULTS SEND 404 HTTP CODE  */
/*---------------------------------------------------*/
function wisepops_search_404_code() {
    if (is_search() && !have_posts()) {
        header($_SERVER['SERVER_PROTOCOL'] . ' 404 Not Found');
        $GLOBALS['wp_query']->is_404 = true;
    }
}
add_action('get_header', 'wisepops_search_404_code');
Wisepops
fonte
@ wisepops.com: Eu tenho o mesmo problema com esse estúpido ataque de spam e pesquisa. Obrigado pelo código! Funcionou muito bem para mim! Agora, a pesquisa vazia retorna um 404 limpo e isso é legal. Atenciosamente, Mitschu
Mitschu
Isso enviaria um usuário real que faz uma pesquisa e obtém zero resultado para uma página 404 também?
brandozz
1

Parece-me que o seu algo está vinculado à funcionalidade de pesquisa do site com consultas ruins. Essas consultas de pesquisa obtêm "nenhum resultado encontrado". O Googlebot está encontrando esses links e você está permitindo que o Googlebot rastreie a pesquisa no site. Por causa dos "sem resultados", o Google os está detectando como "soft 404".

Deixar o Google rastrear os resultados de pesquisa do seu site é um grande não-não. Ele pode penalizar todo o site pelo Google. Consulte Matt Cutts: resultados da pesquisa nos resultados da pesquisa . Você deve proibir todo o rastreamento dos resultados de pesquisa usando o robots.txt :

Disallow: /search
Disallow: /?s=

O Googlebot também não rastreará esses URLs e não reportará erros.

Stephen Ostermiller
fonte
Stephen, isso reslove os 404s suaves? Na verdade, adicionei isso ao meu robots.txt e marquei todos os meus 404 flexíveis na página de pesquisa como corrigidos. Depois de verificar, marcarei isso como correto. Mas esta parece ser a melhor solução.
brandozz