Большие данные

Входные требования: базовые навыки программирования и веб-технологий, знание SQL и СУБД

Зачетные единицы: 5

Курс: По выбору

Язык курса: Английский

Цели

  • Изучение основных причин образования Больших Данных, определение и идентификация Больших Данных
  • Знакомство с технологиями Grid, WMS, MapReduce, потоковой обработки (streaming)
  • Освоение принципов MapReduce и технологией Apache Hadoop
  • Освоение принципов работы HDFS и построения инфраструктура Apache Hadoop
  • Знакомство с технологией Apache Storm

Содержание

Больших Данных на сегодняшний день являются ключевым аспектом в области анализа поведения, а также моделирования многих социальных и экономических эффектов в различных областях науки. Это является серьезным стимулом в освоении данного курса, в ходе которого будет дано краткое описание истории формирования, определения и идентификация направления Больших Данных. Будут представлены основы файловой системы HDFS, а также технологией Apache Hadoop, реализованной поверх HDFS, с применение парадигмы MapReduce. Также будет освоена технология Apache Storm используемая для обработки Больших Данных в потоковом режиме. По завершению обучения студент должен будет обладать навыками работы с основными технологиями Большими Данными, такими как, Apache Hadoop и Apache Storm.  

Формат

Лекции и семинары

Оценка

Присутствие является обязательным.

Оценка: 60% курсовая работа из них: 20% сбор данных, 20% реализация обработки данных на технологии Больших Данных, 20% анализ и написание отчета; 20% работа на семинарах; 20% экзаменационный тест.