MapReduce — модель распределённых вычислений, представленная компанией Google, используемая для параллельных вычислений над очень большими, несколько петабайт, наборами данных в компьютерных кластерах.
MapReduce — это фреймворк для вычисления некоторых наборов распределенных задач с использованием большого количества компьютеров (называемых «нодами»), образующих кластер.
Работа MapReduce состоит из двух шагов: Map и Reduce.
Агрегация – это абстракция, которая превращает связь между объектами в некоторый агрегированный объект.
Пример
по-идее - если при выборки данных из таблицы, мы отбрасываем неуникальные значения - то это уже агрегация, так как мы группируем сходные записи на основе той связи, что они одинаковы.....)