Apakah akurat untuk menyebut kerangka mapReduce jenis kerangka kerja pemrograman paralel paralel massal tanpa retensi memori lokal di dalam prosesor di antara sinkronisasi? Jika tidak, model pemrograman paralel apa yang paling akurat merangkum kerangka mapReduce?
dc.parallel-comp
machine-models
Jeff Kubina
sumber
sumber
Jawaban:
Pada bagian 2 dari http://arxiv.org/abs/1101.1902 , penulis mendefinisikan model MapReduce yang sengaja disusun seperti BSP. Mereka membuktikan teorema simulasi juga. Mungkin tempat yang bagus untuk memulai.
sumber
Ya, pendapat saya adalah bahwa MapReduce klasik adalah model BSP (dan karena itu memiliki keterbatasan yang melekat pada kinerja paralel maksimum yang mungkin dapat dicapai). Namun, pekerjaan yang lebih baru pada MapReduce tampaknya difokuskan pada gagasan sinkronisasi yang lebih longgar, yang akan mengeluarkan "MapReduce umum" dari kerangka BSP yang ketat. Secara khusus, jika seseorang mereplikasi beberapa data maka struktur sinkronisasi dapat dilonggarkan, menghasilkan keuntungan kinerja.
Lihat misalnya karya oleh Foto Afrati dan Jeff Ullman: Mengoptimalkan penggabungan dalam lingkungan pengurangan peta , EDBT 2010. ( pracetak )
sumber
Karena di MapReduce ada grafik sederhana dan terstruktur yang mendasari perhitungan, ini dapat IMHO diklasifikasikan sebagai model aliran data.
sumber