Lancei recentemente o site de um cliente e, nos últimos dias, e com crescente frequência, vejo entradas estranhas no log de acesso.
[28/Feb/2014:06:26:53 +0800] "GET //RS=^ADAA6U_G38x_VuWqDIVQJpBbDUsUW0- HTTP/1.1" 302 630 "http://www.domain.com.au/" "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36"]
e
[28/Feb/2014:06:26:54 +0800] "GET /RS=%5eADAA6U_G38x_VuWqDIVQJpBbDUsUW0- HTTP/1.1" 404 8291 "http://www.domain.com.au/" "Mozilla/5.0 (Windows NT 6.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/27.0.1453.116 Safari/537.36"
A domain.com.au
parte é o endereço real do site. Eu mudei para este post.
Não consigo descobrir o que isso está tentando arquivar, pois está simplesmente configurando outra variável get, que não arquivaria nada, a menos que eu esteja errado.
- Você acha que devemos nos preocupar com esses pedidos?
- Quais são esses pedidos tentando arquivar?
- Algo que podemos fazer para detê-los?
apache-log-files
user3363066
fonte
fonte
Respostas:
Não encontrei nada relacionado a essa solicitação, portanto, se for algo malicioso, ainda não foi descoberto. Também não vejo como isso poderia ser usado para prejudicar seu site.
Dito isso, os bandidos parecem estar um passo à frente de nós. Portanto, se essa solicitação não servir a nenhum propósito útil em seu site, tentarei bloqueá-la. Mesmo que seja apenas para impedir que seus logs sejam poluídos.
Eu diria que você deve tentar bloqueá-los, se possível. As duas partes consistentes dessas solicitações são
/RS=
e,ADAA6U_G38x_VuWqDIVQJpBbDUsUW0
portanto, podem ser o que você focaliza para bloqueá-las.fonte
Eles vêm de raspadores da Web incorretamente usando o Yahoo! Resultado da pesquisa . Essa descoberta foi feita por @tenants no fórum XenForo . Eles explicam mais as implicações de receber esses pedidos e como eles os tratam.
1. Você acha que devemos nos preocupar com esses pedidos?
Você não precisa se preocupar com esses pedidos. Eles são apenas marcas de bots idiotas e bots idiotas que vagam pela Internet. Essas solicitações não devem ser identificadas como maliciosas apenas com base na URL, elas provavelmente são inocentes.
2. O que essas solicitações estão tentando arquivar?
Eles estão tentando obter o conteúdo da página solicitada. Eles não têm efeito especial, são produtos (indesejados) de um Yahoo! Pesquisa raspagem.
3. Algo que podemos fazer para detê-los?
Na verdade, ninguém é livre para postar na Internet os pedidos que quiser . (Pelo menos tecnicamente. Aspectos sociais e legais deixados de lado.)
Você pode jogá-los fora ao gerar relatórios a partir de seus logs. Esta é a opção que eu escolhi.
Ou você pode tentar corrigir os pedidos com êxito e não gerar entradas de log . Provavelmente é isso que mais faço com o que vi na web. Eu vejo uma falha nessa abordagem. Ao melhorar a experiência do visitante, eles esquecem quem são esses visitantes. Bots mudos. Não quero bots burros nos meus sites, para não me incomodar em melhorar a experiência deles.
Se você deseja corrigir os pedidos, pode fazê-lo usando reescrever mod, possivelmente chamado de .htaccess, por exemplo, usando o código da postagem do fórum do XenForo que mencionei acima:
Você pode ter que mexer um pouco com as expressões regulares, por exemplo, adicione uma barra adicional após o
(.*)
caso seus URLs não terminem com uma.Relacionado
Parabéns à resposta de @ dman no Stack Overflow e ao comentário do @webaware nesta pergunta por encontrar a postagem no fórum do XenForo.
fonte