Como enviar um formulário usando o PhantomJS

161

Estou tentando usar o phantomJS (que ferramenta incrível é essa!) Para enviar um formulário para uma página para a qual tenho credenciais de logon e depois enviar o conteúdo da página de destino para o stdout. Consigo acessar o formulário e definir seus valores com êxito usando o phantom, mas não sei ao certo qual é a sintaxe correta para enviar o formulário e gerar o conteúdo da página subseqüente. O que tenho até agora é:

var page = new WebPage();
var url = phantom.args[0];

page.open(url, function (status) {

  if (status !== 'success') {
      console.log('Unable to access network');
  } else {

    console.log(page.evaluate(function () {

      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) {

        if (arr[i].getAttribute('method') == "POST") {
          arr[i].elements["email"].value="[email protected]";
          arr[i].elements["password"].value="mypassword";

          // This part doesn't seem to work. It returns the content
          // of the current page, not the content of the page after 
          // the submit has been executed. Am I correctly instrumenting
          // the submit in Phantom?
          arr[i].submit();
          return document.querySelectorAll('html')[0].outerHTML;
        }

      }

      return "failed :-(";

    }));
  }

  phantom.exit();
}
Vijay Boyapati
fonte

Respostas:

227

Eu descobri. Basicamente, é um problema assíncrono. Você não pode simplesmente enviar e esperar renderizar a página subsequente imediatamente. Você deve esperar até que o evento onLoad da próxima página seja acionado. Meu código está abaixo:

var page = new WebPage(), testindex = 0, loadInProgress = false;

page.onConsoleMessage = function(msg) {
  console.log(msg);
};

page.onLoadStarted = function() {
  loadInProgress = true;
  console.log("load started");
};

page.onLoadFinished = function() {
  loadInProgress = false;
  console.log("load finished");
};

var steps = [
  function() {
    //Load Login Page
    page.open("https://website.com/theformpage/");
  },
  function() {
    //Enter Credentials
    page.evaluate(function() {

      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) { 
        if (arr[i].getAttribute('method') == "POST") {

          arr[i].elements["email"].value="mylogin";
          arr[i].elements["password"].value="mypassword";
          return;
        }
      }
    });
  }, 
  function() {
    //Login
    page.evaluate(function() {
      var arr = document.getElementsByClassName("login-form");
      var i;

      for (i=0; i < arr.length; i++) {
        if (arr[i].getAttribute('method') == "POST") {
          arr[i].submit();
          return;
        }
      }

    });
  }, 
  function() {
    // Output content of page to stdout after form has been submitted
    page.evaluate(function() {
      console.log(document.querySelectorAll('html')[0].outerHTML);
    });
  }
];


interval = setInterval(function() {
  if (!loadInProgress && typeof steps[testindex] == "function") {
    console.log("step " + (testindex + 1));
    steps[testindex]();
    testindex++;
  }
  if (typeof steps[testindex] != "function") {
    console.log("test complete!");
    phantom.exit();
  }
}, 50);
Vijay Boyapati
fonte
3
Este é um ótimo modelo. Aqui estão algumas coisas que eu adicionei: setIntervaluso interno var func = steps[testindex], então console.log("step " + (testindex + 1) + ": " + funcName(func)). Isso permite adicionar descrição às etapas que estão sendo executadas.
Jonno
veja aqui para funcName. Também achei mais fácil ao passar por uma série de páginas da web e tentar técnicas diferentes, renderizar a última página usando page.render("output.png");.
Jonno
2
Este é realmente um post útil. Uma pergunta, porém. Quando você envia um formulário usando o POST, os dados são enviados ao servidor e o servidor retorna a resposta. Onde está o código em que você lida com essa resposta ou é feito automaticamente pelo phantomjs? Além disso, após o envio do formulário, um servidor pode retornar COOKIEe minha pergunta é: * este cookie está disponível no phantom.cookiesobjeto quando o servidor retorna a resposta * ?
MrDev15
uso CasperJS seu mais melhor do que PhantomJS, a sua tem a habilidade de postar em formulários sem complexo de codificação
waza123
Poderia, por favor verifique isso também stackoverflow.com/questions/44624964/phantom-js-on-web-project
Manik
62

Além disso, o CasperJS fornece uma ótima interface de alto nível para navegação no PhantomJS, incluindo clicar em links e preencher formulários.

CasperJS

Atualizado para adicionar artigo de 28 de julho de 2015 comparando PhantomJS e CasperJS .

(Obrigado ao comentarista Sr. M!)

arboc7
fonte
1
Casper não funcionou para mim porque você só podia preencher uma entrada de formulário usando o nome. Eu precisava usar o id.
precisa saber é o seguinte
4
@ user984003 Deverá poder definir o seu seletor #someidpara preencher com base em um ID.
arboc7
2
CasperJS é uma dádiva de Deus! Torna fácil raspar páginas ASPX. Obrigado!
Tobia 28/05
@ user984003 Não sei se você estava usando uma versão mais antiga, mas a atual possui um fillSelectors () para preencher os campos do formulário usando qualquer seletor.
Tobia 28/05
3
Qualquer pessoa que esteja usando o PhantomJS deve começar a usar o CasperJS. Aqui está post descrevendo o porquê: code-epicenter.com/why-is-casperjs-better-than-phantomjs
MrD
19

Enviar solicitações POST brutas às vezes pode ser mais conveniente. Abaixo você pode ver o exemplo original post.js do PhantomJS

// Example using HTTP POST operation

var page = require('webpage').create(),
    server = 'http://posttestserver.com/post.php?dump',
    data = 'universe=expanding&answer=42';

page.open(server, 'post', data, function (status) {
    if (status !== 'success') {
        console.log('Unable to post!');
    } else {
        console.log(page.content);
    }
    phantom.exit();
});
Jakub M.
fonte
6
Esteja ciente, leitores, de que executar GETsolicitações de maneira semelhante (fazendo algo parecido page.open(server, 'get', data, ...) não funcionará.
ZBR
7

Como mencionado acima, o CasperJS é a melhor ferramenta para preencher e enviar formulários. Exemplo mais simples possível de como preencher e enviar um formulário usando a função fill () :

casper.start("http://example.com/login", function() {
//searches and fills the form with id="loginForm"
  this.fill('form#loginForm', {
    'login':    'admin',
    'password':    '12345678'
   }, true);
  this.evaluate(function(){
    //trigger click event on submit button
    document.querySelector('input[type="submit"]').click();
  });
});
DominikStyp
fonte