• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Книга
Integral Robot Technologies and Speech Behavior

Kharlamov A. A., Pantiukhin D., Borisov V. et al.

Newcastle upon Tyne: Cambridge Scholars Publishing, 2024.

Статья
О количестве k-доминирующих независимых множеств в планарных графах

Талецкий Д. С.

Дискретный анализ и исследование операций. 2024. Т. 31. № 1. С. 109-128.

Глава в книге
Neural Networks for Speech Synthesis of Voice Assistants and Singing Machines

Pantiukhin D.

In bk.: Integral Robot Technologies and Speech Behavior. Newcastle upon Tyne: Cambridge Scholars Publishing, 2024. Ch. 9. P. 281-296.

Технологии работы с большими массивами данных

2020/2021
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Изучение данной дисциплины базируется на следующих дисциплинах: • Дискретная математика • Теория вероятности • Исследование операций. В результате освоения дисциплины студент должен: • Знать основные характеристики больших данных, знать основные технологии, применяемые для хранения и поиска в больших данных. • Уметь применять методы анализа больших данных, уметь реализовывать приложения для аналитики больших данных
Цель освоения дисциплины

Цель освоения дисциплины

  • Ознакомление с основными технологиями решения задач обработки больших по объему, быстро изменяющихся и плохо структурированных данных, объединяемых термином «большие данные»
Планируемые результаты обучения

Планируемые результаты обучения

  • Знать определения в области больших данных. Международные стандарты
  • Уметь планировать жизненный цикл проектов по аналитике больших данных
  • Уметь разрабатывать программные решения для сбора и визуализации данных с использованием библиотек Python
  • Знать архитектуру платформ работы с большими данными Hadoop, Spark, SparkX, Neo4J и уметь разрабатывать приложения на этих платформах
  • Ознакомиться с типовыми решениями в прикладных задачах
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Тема 1. Большие данные как феномен ИТ и их роль в технике, экономике и жизни
    Определение термина большие данные и базовая модель. Применение больших данных. Роль больших данных в национальной экономике. Требования к профессии аналитика больших данных
  • Тема 2. Жизненный цикл проекта по аналитике больших данных
    Основные этапы жизненного цикла. Сбор, консолидация и очистка данных. Построение моделей, роль машинного обучения
  • Тема 3. Основные техники работы с большими данными
    Сбор и консолидация данных, визуализация данных, язык Python для аналитики, библиотека Tensor Flow, работа с СУБД
  • Тема 4. Основные технологии и инструменты работы с большими данными
    Hadoop, HDFS, Map/Reduce, YARN, Storm, Apache Spark
  • Тема 5. Приложения больших данных
    Особенности разработки программных решений, использующих большие данные. Обучаемые модели на структурированных данных. Примеры использования технологий больших данных в актуальных приложениях
Элементы контроля

Элементы контроля

  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
  • неблокирующий Домашнее задание
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (2 модуль)
    0.4 * Домашнее задание + 0.6 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Структуры и алгоритмы обработки данных: Учебное пособие / Колдаев В.Д. - М.:ИЦ РИОР, НИЦ ИНФРА-М, 2014. - 296 с.: 60x90 1/16. - (Высшее образование: Бакалавриат) (Переплёт 7БЦ) ISBN 978-5-369-01264-2 - Режим доступа: http://znanium.com/catalog/product/418290

Рекомендуемая дополнительная литература

  • Просчитать будущее: Кто кликнет, купит, соврет или умрет / Сигель Э. - М.:Альпина Пабл., 2016. - 374 с.: ISBN 978-5-9614-4541-1 - Режим доступа: http://znanium.com/catalog/product/917151