É preciso chamar a estrutura mapReduce de um tipo de estrutura de programação paralela síncrona em massa sem retenção de memória local nos processadores entre as sincronizações? Caso contrário, qual modelo de programação paralela encapsula com mais precisão a estrutura mapReduce?
dc.parallel-comp
machine-models
Jeff Kubina
fonte
fonte
Respostas:
Na seção 2 de http://arxiv.org/abs/1101.1902 , os autores definem um modelo de MapReduce que é intencionalmente estruturado como o BSP. Eles também provam teoremas de simulação. Pode ser um bom lugar para começar.
fonte
Sim, minha opinião é que o MapReduce clássico é um modelo BSP (e, portanto, tem suas limitações inerentes ao máximo desempenho paralelo possível que pode ser alcançado). No entanto, o trabalho mais recente do MapReduce parece estar focado em noções mais frouxas de sincronização, o que tiraria esse "MapReduce generalizado" da estrutura estrita do BSP. Em particular, se alguém replicar alguns dados, a estrutura de sincronização poderá ser relaxada, gerando ganhos de desempenho.
Veja, por exemplo, o trabalho de Foto Afrati e Jeff Ullman: Otimizando junções em um ambiente de redução de mapa , EDBT 2010. ( pré-impressão )
fonte
Como no MapReduce existe um gráfico simples e estruturado subjacente à computação, isso pode ser classificado como um modelo de fluxo de dados.
fonte