O Google envia formulários HTML?

10

Eu tenho uma página da web, digamos, http://domain/purchasee nesta página, tenho um formulário da web. O usuário, ao enviar este formulário (que possui validação, tanto do lado do cliente quanto do servidor, e não será validado até que os campos sejam preenchidos adequadamente), seria redirecionado para outra página, onde poderá escolher outras coisas e especificar outras configurações e compre nosso produto. Digamos que a segunda página seja http://domain/options.

Assim, o usuário chega ao nosso site e visita http://domain/purchase, preenche o formulário, o envia e depois é redirecionado para a segunda página http://doamin/options?parameter1=value1&parameter2=value2, que contém parâmetros da primeira página. Isso é muito comum na passagem de parâmetros entre páginas da Web (ou tecnicamente, entre URLs).

Agora eu estava revisando meu site e vi que o Google havia indexado algumas das minhas páginas da web e URLs redirecionados, como:

  1. http://domain/options?parameter1=value1&parameter2=value2
  2. http://domain/options?parameter1=value3&parameter2=value4
  3. http://domain/options?parameter1=value5&parameter2=value6
  4. http://domain/options?parameter1=value7&parameter2=value8
  5. http://domain/options?parameter1=value9&parameter2=value10

Isso significa que o Google Bot visitou nossa http://domain/purchasepágina, preencheu nosso formulário e o enviou e estava sendo redirecionado para o outro URL, com os parâmetros correspondentes. Esta é a única maneira que faz sentido para mim. O Google realmente preenche formulários?

PS: Todos os parâmetros são significativos, o que significa que não são preenchidos arbitrariamente. Por exemplo, o parâmetro phone nas páginas indexadas possui números de telefone corretos. Como isso é possível?

Saeed Neamati
fonte

Respostas:

8

O Google consegue rastrear formulários HTML desde 2008 .

Depois de escolher os valores para cada entrada, geramos e tentamos rastrear URLs que correspondem a uma possível consulta que um usuário possa ter feito. Se verificarmos que a página da web resultante de nossa consulta é válida, interessante e inclui conteúdo que não está em nosso índice, podemos incluí-la em nosso índice da mesma forma que incluiríamos qualquer outra página da web.

Por outro lado, como é improvável que o GoogleBot conheça os parâmetros corretos para colocar nesses campos, pode haver outra explicação. É possível que seus usuários estejam vinculando às páginas redirecionadas?

Kat
fonte
Este vídeo do Google para webmasters também abrange os dois pontos: youtube.com/watch?v=xS0oHYZafTQ
DisgruntledGoat
Ele diz que eles apenas rastreiam formulários GET . Meu método de formulário é POST . Assim, não aplicável. Sim, por que não, os URLs são sempre capazes de vincular.
Saeed Neamati
5
Se você está vendo ?parameter1=value9&parameter2=value10nos URLs, eles estão obtendo-os; O POST não incorpora as variáveis ​​de formulário no URL.
Wooble
@ Woobie: Nesse caso, os parâmetros de URL parecem ser o resultado de um redirecionamento do servidor, após o formulário ter sido POSTADO.
MrWhite
4

O Google está ficando mais agressivo quando se trata de enviar formulários.

John Conde
fonte
A linha principal é: "Começamos experimentos para reescrever solicitações POST para GET";)
Zhaph - Ben Duguid 02/12/11