Подходы к эффективному исполнению итеративных алгоритмов на модели MapReduce

Итеративные алгоритмы представляют собой важный класс задач и встречаются во многих областях, таких, как data-mining, машинное обучение, ссылочный анализ и др. Наиболее известным и часто применимым инструментом обработки «больших данных» является модель MapReduce, и в частности ее открытая реализация Hadoop. В данной статье приводится обзор существующих подходов к реализации модели MapReduce, поддерживающей эффективное выполнение итеративных алгоритмов. Показано, что основным моментом, отрицательно влияющим на производительность итеративных алгоритмов на модели MapReduce, является дисковый и сетевой ввод-вывод, которого в большинстве случаев можно избежать посредством различных модификаций модели и программной среды, ее реализующей.

Авторы: А. В. Митяков, Ю. С. Татаринов

Направление: Информатика, управление и компьютерные технологии

Ключевые слова: Big-data, обработка данных, MapReduce, итеративные алгоритмы


Открыть полный текст статьи