A questão é o que você quer dizer com falhanços? Se tudo o que importa é quantas operações mais simples de ponto flutuante por relógio, provavelmente é 3x a velocidade do relógio, mas isso é tão sem sentido quanto os bogomips. Algumas operações de ponto flutuante demoram muito tempo (dividir, para iniciantes), adicionar e multiplicar são geralmente rápidas (uma por unidade de fp por relógio). O próximo problema é o desempenho da memória; há uma razão para o último CRAY clássico ter 31 bancos de memória; no final, o desempenho da CPU é limitado pela rapidez com que você pode ler e gravar na memória; portanto, em que nível de cache o seu problema se encaixa? O Linpack foi uma referência real uma vez, agora se encaixa no cache (L2, se não L1) e é mais um benchmark teórico puro da CPU. E, é claro, suas unidades SSE (etc) também podem adicionar desempenho de ponto flutuante.
Que distro você executa?
Parecia um bom ponteiro: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ pode ser uma maneira mais fácil de instalar uma referência de fracassos.
Ainda me pergunto por que você se importa, para que está usando? Se você quer apenas um número sem sentido, o bogomips do seu sistema ainda está lá no dmesg.
aparentemente existe um pacote e comando de benchmark "sysbench":
sudo apt-get install sysbench
(oubrew install sysbench
OS X)execute assim:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
saída para comparações:
ref: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
fonte
Para estimativas aproximadas:
Raspberry Pi 2 : 299,93 * 10 ^ 6 FLOPS ( origem )
Raspberry Pi 3: 462,07 * 10 ^ 6 FLOPS ( origem )
Linpack
cd benchmarks_2017/linux/mkl/benchmarks/linpack
./runme_xeon64
Em um Thinkpad T460p ( CPU Intel i7-6700HQ ), ele fornece:
fonte
Uma referência tradicionalmente usada para medir os FLOPS é o Linpack. Outro parâmetro comum do FLOPS é o Whetstone.
Mais leitura: Entrada "FLOPS" da Wikipedia , entrada Whetstone , entrada Linpack
fonte
Eu recomendo a compilação do linpack pronta para executar da Intel: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
fonte
Como você mencionou o cluster, usamos o conjunto HPCC . É preciso um pouco de esforço para configurar e ajustar, mas, no nosso caso, o ponto não estava se gabando por si só, fazia parte dos critérios de aceitação do cluster; alguns benchmarking de desempenho são essenciais para garantir que o hardware funcione conforme anunciado, tudo esteja corretamente conectado etc.
Agora, se você quer apenas um número FLOPS de pico teórico, esse é fácil. Basta verificar um artigo sobre a CPU (digamos, no realworldtech.com ou algo assim) para obter informações sobre quantos DP FLOPS um núcleo de CPU pode fazer por ciclo de clock (com as atuais CPUs x86 que geralmente são 4). Então o pico total de FLOPS é apenas
número de núcleos * FLOPS / ciclo * frequência
Então, para um cluster com rede IB, você poderá atingir cerca de 80% do pico de FLOPS no HPL (que BTW é um dos parâmetros de referência no HPCC).
fonte