Xeon vs i7 Extreme com overclock para menor latência

9

Estou ciente de que as diferenças entre o high-end i7 e o Xeon são:

  1. compatibilidade com placas-mãe de soquete duplo,
  2. tamanho total do cache L2 / L3.
  3. capacidade de overclock.
  4. núcleos extras - Haswell i7-4960X vs E7.
  5. consumo de energia.

(Veja: Qual é a diferença entre um processador Intel i7 e um processador quad core Xeon? )

O que eu gostaria de perguntar é: quais são as implicações do tamanho do cache na obtenção da menor latência?

Parece que eu prefiro ter um processador i7 Extreme com overclock pesado do que um processador Xeon e não consigo imaginar como um cache extra de 5 a 15 MB fará uma diferença significativa, exceto em alguns casos extremos nos quais o conjunto de problemas é grande demais para o cache L2 e pequeno o suficiente para não precisar confiar na memória principal. Estou perdendo alguma vantagem dos processadores Xeon?

PS: Estamos implantando hardware para detectores de neutrinos para física de alta energia e precisamos de um tempo de resposta muito rápido, mas não de grandes cálculos matriciais. Alguns dirão que eu deveria estar usando alguma estratégia ASIC / RISC + RTOS para alcançar meus objetivos, mas da maneira como os experimentos são projetados, eu só preciso de uma latência interna de 10 microssegundos (pressionando o soquete para sair), o que parece possível com os processadores regulares .

elleciel
fonte
5
Gargalo real seria a conexão entre a porta do computador e o detector.
huseyin tugrul buyukisik
3
O FPGA pode ser uma solução melhor (e mais barata) para essa aplicação.
gronostaj
Você pode ser mais preciso sobre quando os 10 microssegundos começam e quando terminam? Como Huseyin apontou, minimizar a latência do hardware será crítico. Hardware e software de uso geral são péssimos nisso.
David Schwartz
Isso é totalmente factível. Mas não execute janelas. Xeon não seria necessário. Overclocking provavelmente não ajudará tanto quanto você pensa.
Matt H

Respostas:

1

Anandtech fez uma revisão detalhada do Core i7 4960x recentemente.

Latência da memória vs. faixa de acesso

Mas, honestamente, esses tempos não significam muito sem saber que tipo de algoritmo você está usando. Supondo que não haja muito processamento a ser feito, a conexão Ethernet será o verdadeiro gargalo, como disse @huseyin

cmorse
fonte
1

A única vantagem dos processadores Xeon sobre o i7 é a capacidade de manipulação de memória e sua resiliência. O i7 tem certamente mais taxa de clock e não suporta grande quantidade de memória. O cache extra apenas torna a Memória Física capaz de lidar com grandes dados e processamento de E / S. Também o Hyper-threading faz isso para a Intel. Isso mostrará uma diferença apenas se você estiver controlando diretamente o processador pelo seu algoritmo.

Se você hesitar em usar a estratégia ASIC / RISC + RTOS, poderá avançar com qualquer sistema operacional baseado em Linux de 64 bits no processador Intel® Core ™ i7-990X Extreme Edition (cache 12M, 3,46 GHz, 6,40 GT / s Intel® QPI ) o melhor oferecido pela Intel.

Além disso, se você estiver pensando em usar o processador para uma grande quantidade de dados em um futuro próximo, minha escolha será definitivamente o processador Intel® Xeon® E7-8870 (cache de 30M, 2,40 GHz, Intel® QPI de 6,40 GT / s) . isso está tendo uma menor taxa de clock e, portanto, mais latência.

Shashank Bajpai
fonte
1

Eu recomendaria um cRIO da Nation Instruments . Ele possui uma CPU Intel i7 e um FPGA. Pode rodar Windows, Linux ou RTOS. Você pode programá-lo em um idioma de alto nível e executar o código no i7 ou no FPGA. A conectividade de hardware de baixo nível aos seus sensores fornecerá uma latência muito menor do que qualquer PC.

Monstieur
fonte