Subtraindo números inteiros de 8 bits em um número inteiro de 64 bits por 1 em paralelo, SWAR sem hardware SIMD

Se eu tiver um número inteiro de 64 bits, estou interpretando como uma matriz de números inteiros de 8 bits compactados com 8 elementos. Preciso subtrair a constante 1de cada número inteiro compactado enquanto lida com o estouro sem que o resultado de um elemento afete o resultado de outro...