Qual é a maneira canônica de verificar se há erros usando a API de tempo de execução CUDA?

Examinando as respostas e os comentários sobre as perguntas da CUDA, e no wiki da tag CUDA , vejo que é frequentemente sugerido que o status de retorno de cada chamada de API seja verificado quanto a erros. A documentação da API contém funções como cudaGetLastError, cudaPeekAtLastErrore...