Escrevo códigos em Fortran e C para vários algoritmos matriciais. No entanto, quando eu perfil meus códigos usando o VTune, geralmente encontro alguma terminologia que não consigo apreciar completamente. Existe um bom recurso para aprender a criar perfis do zero para um nível bastante avançado?
Embora eu esteja ansioso para criar códigos numéricos, não acho (posso estar errado) que o perfil de outros códigos seja diferente. Quero um tutorial sobre criação de perfis e preferiria um PDF on-line (gratuito), mas não me importaria de livros ou manuais.
Tentei ler o manual do VTune, mas é como tentar aprender chinês lendo um livro em chinês.
Além disso, o VTune é o melhor caminho a percorrer? Eu realmente gosto de uma GUI e, como uso o Intel MKL, achei que seria melhor que o Valgrind.
fonte
Se você está interessado em análise de desempenho de códigos paralelos, eu gosto do livro: Scientific Parallel Computing, L. Ridgway Scott, Terry Clark, Babak Bagheri .
Além disso, aqui estão alguns slides legais usados em um curso da escola de verão ministrado (PASI. Valparaíso, Chile. Janeiro de 2011) por um dos autores, o material é baseado no livro.
fonte
A ferramenta que usei extensivamente para criação de perfil é o valgrind (em combinação com a interface gráfica kcachegrind ). O Valgrind é um conjunto de ferramentas de análise dinâmica: detecção de erros de memória, detecção de erros de threading e criação de perfil.
Algumas referências sobre Valgrind:
Infelizmente (depende de onde você vem :-)), o valgrind não roda no Windows, apenas em máquinas baseadas em Linux e Darwin.
fonte