Eu estava procurando o caminho mais rápido para popcountgrandes matrizes de dados. Eu encontrei um efeito muito estranho : alterar a variável de loop de unsignedpara uint64_treduzir o desempenho em 50% no meu PC. O benchmark #include <iostream> #include <chrono> #include...