Desempenho do foreach, array_map com lambda e array_map com função estática

144

Qual é a diferença de desempenho (se houver) entre essas três abordagens, ambas usadas para transformar uma matriz em outra matriz?

  1. Usando foreach
  2. Usando array_mapcom a função lambda / encerramento
  3. Usando array_mapcom função / método 'estático'
  4. Existe alguma outra abordagem?

Para me esclarecer, vejamos os exemplos, todos fazendo o mesmo - multiplicando a matriz de números por 10:

$numbers = range(0, 1000);

Para cada

$result = array();
foreach ($numbers as $number) {
    $result[] = $number * 10;
}
return $result;

Mapa com lambda

return array_map(function($number) {
    return $number * 10;
}, $numbers);

Mapa com a função 'estática', passada como referência de string

function tenTimes($number) {
    return $number * 10;
}
return array_map('tenTimes', $numbers);

Existe alguma outra abordagem? Ficarei feliz em ouvir, na verdade, todas as diferenças entre os casos acima e quaisquer sugestões de por que um deve ser usado em vez de outros.

Pavel S.
fonte
10
Por que você não apenas avalia e vê o que acontece?
9133 Jon
17
Bem, eu posso fazer uma referência. Mas ainda não sei como funciona internamente. Mesmo se eu descobrir que um é mais rápido, ainda não sei o porquê. É por causa da versão do PHP? Depende dos dados? Existe uma diferença entre matrizes associativas e ordinárias? É claro que posso fazer todo um conjunto de parâmetros de referência, mas obter alguma teoria economiza muito tempo aqui. Espero que você entenda ...
Pavel S.
2
Comentário tardio, mas não é o tempo (lista ($ k, $ v) = cada ($ matriz)) mais rápido que o acima? Não testei isso no php5.6, mas estava nas versões anteriores.
Owen Beresford

Respostas:

121

FWIW, eu apenas fiz o benchmark, pois o cartaz não o fez. Rodando no PHP 5.3.10 + XDebug.

ATUALIZAÇÃO 2015-01-22 Compare com a resposta do mcfedr abaixo para obter resultados adicionais sem o XDebug e uma versão mais recente do PHP.


function lap($func) {
  $t0 = microtime(1);
  $numbers = range(0, 1000000);
  $ret = $func($numbers);
  $t1 = microtime(1);
  return array($t1 - $t0, $ret);
}

function useForeach($numbers)  {
  $result = array();
  foreach ($numbers as $number) {
      $result[] = $number * 10;
  }
  return $result;
}

function useMapClosure($numbers) {
  return array_map(function($number) {
      return $number * 10;
  }, $numbers);
}

function _tenTimes($number) {
    return $number * 10;
}

function useMapNamed($numbers) {
  return array_map('_tenTimes', $numbers);
}

foreach (array('Foreach', 'MapClosure', 'MapNamed') as $callback) {
  list($delay,) = lap("use$callback");
  echo "$callback: $delay\n";
}

Eu obtenho resultados bastante consistentes com números de 1 milhão em uma dúzia de tentativas:

  • Foreach: 0,7 seg
  • Mapa de encerramento: 3,4 seg
  • Mapa no nome da função: 1,2 seg.

Supondo que a velocidade sem brilho do mapa no fechamento foi causada pelo fato de o fechamento ser avaliado a cada vez, também testei assim:


function useMapClosure($numbers) {
  $closure = function($number) {
    return $number * 10;
  };

  return array_map($closure, $numbers);
}

Mas os resultados são idênticos, confirmando que o fechamento é avaliado apenas uma vez.

02-02-2014 ATUALIZAÇÃO: despejo de opcodes

Aqui estão os dumps do opcode para os três retornos de chamada. Primeiro useForeach():



compiled vars:  !0 = $numbers, !1 = $result, !2 = $number
line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
  10     0  >   EXT_NOP                                                  
         1      RECV                                                     1
  11     2      EXT_STMT                                                 
         3      INIT_ARRAY                                       ~0      
         4      ASSIGN                                                   !1, ~0
  12     5      EXT_STMT                                                 
         6    > FE_RESET                                         $2      !0, ->15
         7  > > FE_FETCH                                         $3      $2, ->15
         8  >   OP_DATA                                                  
         9      ASSIGN                                                   !2, $3
  13    10      EXT_STMT                                                 
        11      MUL                                              ~6      !2, 10
        12      ASSIGN_DIM                                               !1
        13      OP_DATA                                                  ~6, $7
  14    14    > JMP                                                      ->7
        15  >   SWITCH_FREE                                              $2
  15    16      EXT_STMT                                                 
        17    > RETURN                                                   !1
  16    18*     EXT_STMT                                                 
        19*   > RETURN                                                   null

Então o useMapClosure()


compiled vars:  !0 = $numbers
line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
  18     0  >   EXT_NOP                                                  
         1      RECV                                                     1
  19     2      EXT_STMT                                                 
         3      EXT_FCALL_BEGIN                                          
         4      DECLARE_LAMBDA_FUNCTION                                  '%00%7Bclosure%7D%2Ftmp%2Flap.php0x7f7fc1424173'
  21     5      SEND_VAL                                                 ~0
         6      SEND_VAR                                                 !0
         7      DO_FCALL                                      2  $1      'array_map'
         8      EXT_FCALL_END                                            
         9    > RETURN                                                   $1
  22    10*     EXT_STMT                                                 
        11*   > RETURN                                                   null

e o fechamento que chama:


compiled vars:  !0 = $number
line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
  19     0  >   EXT_NOP                                                  
         1      RECV                                                     1
  20     2      EXT_STMT                                                 
         3      MUL                                              ~0      !0, 10
         4    > RETURN                                                   ~0
  21     5*     EXT_STMT                                                 
         6*   > RETURN                                                   null

então a useMapNamed()função:


compiled vars:  !0 = $numbers
line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
  28     0  >   EXT_NOP                                                  
         1      RECV                                                     1
  29     2      EXT_STMT                                                 
         3      EXT_FCALL_BEGIN                                          
         4      SEND_VAL                                                 '_tenTimes'
         5      SEND_VAR                                                 !0
         6      DO_FCALL                                      2  $0      'array_map'
         7      EXT_FCALL_END                                            
         8    > RETURN                                                   $0
  30     9*     EXT_STMT                                                 
        10*   > RETURN                                                   null

e a função nomeada que chama _tenTimes():


compiled vars:  !0 = $number
line     # *  op                           fetch          ext  return  operands
---------------------------------------------------------------------------------
  24     0  >   EXT_NOP                                                  
         1      RECV                                                     1
  25     2      EXT_STMT                                                 
         3      MUL                                              ~0      !0, 10
         4    > RETURN                                                   ~0
  26     5*     EXT_STMT                                                 
         6*   > RETURN                                                   null

FGM
fonte
Obrigado pelos benchmarks. No entanto, gostaria de saber por que existe essa diferença. É por causa de uma sobrecarga de chamada de função?
Pavel S.
4
Eu adicionei os dumps do opcode na edição. A primeira coisa que podemos ver é que a função e o fechamento nomeados têm exatamente o mesmo dump e são chamados via array_map da mesma maneira, com apenas uma exceção: a chamada de fechamento inclui mais um código de operação DECLARE_LAMBDA_FUNCTION, que explica por que usá-lo. um pouco mais lento do que usar a função nomeada. Agora, comparando as chamadas loop de matriz e array_map, tudo no loop de matriz é interpretado em linha, sem nenhuma chamada para uma função, significando que não há contexto para pressionar / pop, apenas um JMP no final do loop, o que provavelmente explica a grande diferença .
FGM
4
Eu apenas tentei isso usando uma função interna (strtolower) e, nesse caso, useMapNamedé realmente mais rápido que useArray. Pensei que valia a pena mencionar.
usar o seguinte
1
Em lap, você não deseja a range()chamada acima da primeira chamada de microtime? (Embora provavelmente insignificante em comparação com o tempo para o loop).
contrebis 27/01
1
@billynoah PHP7.x é muito mais rápido mesmo. Seria interessante ver os opcodes gerados por esta versão, especialmente comparando com / sem opcache, pois faz muitas otimizações além do cache de código.
FGM 14/01
231

É interessante executar esse benchmark com o xdebug desativado, pois o xdebug adiciona bastante sobrecarga, especialmente às chamadas de função.

Este é o script do FGM executado usando o 5.6 With xdebug

ForEach   : 0.79232501983643
MapClosure: 4.1082420349121
MapNamed  : 1.7884571552277

Sem xdebug

ForEach   : 0.69830799102783
MapClosure: 0.78584599494934
MapNamed  : 0.85125398635864

Aqui há apenas uma diferença muito pequena entre a versão foreach e encerramento.

Também é interessante adicionar uma versão com um fechamento com um use

function useMapClosureI($numbers) {
  $i = 10;
  return array_map(function($number) use ($i) {
      return $number * $i++;
  }, $numbers);
}

Para comparação, eu adiciono:

function useForEachI($numbers)  {
  $result = array();
  $i = 10;
  foreach ($numbers as $number) {
    $result[] = $number * $i++;
  }
  return $result;
}

Aqui podemos ver que isso afeta a versão de fechamento, enquanto a matriz não mudou visivelmente.

19/11/2015 Agora também adicionei resultados usando o PHP 7 e o HHVM para comparação. As conclusões são semelhantes, embora tudo seja muito mais rápido.

PHP 5.6

ForEach    : 0.57499806880951
MapClosure : 0.59327731132507
MapNamed   : 0.69694859981537
MapClosureI: 0.73265469074249
ForEachI   : 0.60068697929382

PHP 7

ForEach    : 0.11297199726105
MapClosure : 0.16404168605804
MapNamed   : 0.11067249774933
MapClosureI: 0.19481580257416
ForEachI   : 0.10989861488342

HHVM

ForEach    : 0.090071058273315
MapClosure : 0.10432276725769
MapNamed   : 0.1091267824173
MapClosureI: 0.11197068691254
ForEachI   : 0.092114186286926
mcfedr
fonte
2
Declaro o vencedor vencendo o empate e dando o 51º voto positivo. MUITO importante para garantir que o teste não altere os resultados! Porém, as perguntas para os resultados de "Matriz" são o método de loop foreach, certo?
Buttle Butkus
2
Excelente respone. É bom ver o quão rápido o 7 é. Preciso começar a usá-lo no meu tempo pessoal, ainda às 5,6 no trabalho.
Dan
1
Então, por que devemos usar array_map em vez de foreach? Por que foi adicionado ao PHP se o desempenho é ruim? Existe alguma condição específica que precise de array_map em vez de foreach? Existe alguma lógica específica que o foreach não possa manipular e o array_map possa manipular?
precisa saber é o seguinte
3
array_map(e suas funções relacionadas array_reduce, array_filter) permitem escrever código bonito. Se array_mapfosse muito mais lento, seria uma razão para usar foreach, mas é muito semelhante, então eu usarei em array_mapqualquer lugar que faça sentido.
Mcfedr
3
É bom ver que o PHP7 é muito melhorado. Estava prestes a mudar para uma linguagem de back-end diferente para meus projetos, mas continuarei com o PHP.
Realnsleo #
8

É interessante. Mas eu tenho um resultado oposto com os seguintes códigos que são simplificados em meus projetos atuais:

// test a simple array_map in the real world.
function test_array_map($data){
    return array_map(function($row){
        return array(
            'productId' => $row['id'] + 1,
            'productName' => $row['name'],
            'desc' => $row['remark']
        );
    }, $data);
}

// Another with local variable $i
function test_array_map_use_local($data){
    $i = 0;
    return array_map(function($row) use ($i) {
        $i++;
        return array(
            'productId' => $row['id'] + $i,
            'productName' => $row['name'],
            'desc' => $row['remark']
        );
    }, $data);
}

// test a simple foreach in the real world
function test_foreach($data){
    $result = array();
    foreach ($data as $row) {
        $tmp = array();
        $tmp['productId'] = $row['id'] + 1;
        $tmp['productName'] = $row['name'];
        $tmp['desc'] = $row['remark'];
        $result[] = $tmp;
    }
    return $result;
}

// Another with local variable $i
function test_foreach_use_local($data){
    $result = array();
    $i = 0;
    foreach ($data as $row) {
        $i++;
        $tmp = array();
        $tmp['productId'] = $row['id'] + $i;
        $tmp['productName'] = $row['name'];
        $tmp['desc'] = $row['remark'];
        $result[] = $tmp;
    }
    return $result;
}

Aqui estão meus dados e códigos de teste:

$data = array_fill(0, 10000, array(
    'id' => 1,
    'name' => 'test',
    'remark' => 'ok'
));

$tests = array(
    'array_map' => array(),
    'foreach' => array(),
    'array_map_use_local' => array(),
    'foreach_use_local' => array(),
);

for ($i = 0; $i < 100; $i++){
    foreach ($tests as $testName => &$records) {
        $start = microtime(true);
        call_user_func("test_$testName", $data);
        $delta = microtime(true) - $start;
        $records[] = $delta;
    }
}

// output result:
foreach ($tests as $name => &$records) {
    printf('%.4f : %s '.PHP_EOL, 
              array_sum($records) / count($records), $name);
}

O resultado é:

0.0098: array_map
0.0114: foreach
0.0114: array_map_use_local
0.0115: foreach_use_local

Meus testes foram no ambiente de produção LAMP sem xdebug. Estou vagando pelo xdebug diminuiria o desempenho do array_map.

Clarence
fonte
Não tenho certeza se você tivesse o trabalho de ler @mcfedr resposta, mas ele explica claramente que XDebug na verdade desacelera array_map;)
igorsantos07
Tenho desempenho de teste array_mape foreachuso do Xhprof. E é interessante array_mapconsome mais memória que `foreach '.
Gopal Joshi