Qual modelo paralelo teórico é o mais próximo do modelo de programação CUDA / OpenCL?
Por exemplo, ele se encaixa em algum grau ao modelo genérico da máquina de acesso aleatório paralelo (PRAM). No entanto, isso é genérico demais, pois abstrai várias latências de acesso à memória e problemas de sincronização.
Minha pergunta é: qual é o modelo teórico em que a arquitetura CUDA se encaixa mais próximo (considerando o paralelismo hierárquico de threads e os blocos de threads que cooperam)?
fonte