We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis and Data Mining

2021/2022
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
4 year, 1 module

Instructor


Grechikhin, Ivan

Программа дисциплины

Аннотация

Настоящая дисциплина относится к профессиональному циклу дисциплин, обеспечивающих подготовку бакалавра по направлению «прикладная математика и информатика». Изучение данной дисциплины базируется на знании, полученных при освоении дисциплин: линейная алгебра и геометрия, математический анализ, дискретная математика, математическая статистика, программировании.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ и разработка данных» является получение высшего профессионально профилированного (на уровне бакалавра) образования, позволяющего выпускнику успешно работать в избранной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мо-бильности и устойчивости на рынке труда.
  • Целью освоения дисциплины «Анализ и разработка данных» является получение высшего профессионально профилированного (на уровне бакалавра) образования, позволяющего выпускнику успешно работать в избранной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знание алгоритмов классификации на основе ансамблей простейших алгоритмов
  • Знание задачи и алгоритмов кластеризации
  • Знание простейших алгоритмов классификации
  • Изучение техники сокращения размерности
  • Ознакомление с задачами регресии и способами их решения
  • Ознакомление с задачей классификации
  • Понимание основ работы с данными
  • Умение готовить данные для обучения и поддерживать процесс обучения
  • Знакомство с нейронными сетями
  • Знание известных архитектур классификации изображений
  • Знание последних результатов в области глубокого обучения
  • Понимание математических основ алгоритма обратного распространения ошибок
  • Понимание уязвимых мест нейронных сетей и возможных проблем в их работе
  • Понимание целей использования свёрточных и рекуррентных слоёв нейронной сети
  • Умение создавать архитектуры нейронных сетей и настраивать их для поставленных целей
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в анализ данных. Описательные статистики.
  • Анализ главных компонент для выявления скрытых факторов и сокращения размерности
  • Кластеризация
  • Нейронные сети: основы
  • Регрессия. Алгоритмы регрессии.
  • Нейронные сети: настройка
  • Задача классификации. Простейшие алгоритмы классификации.
  • Архитектуры нейронных сетей
  • Алгоритмы классификации - ансамбли
Элементы контроля

Элементы контроля

  • блокирующий лабораторные работы
    5 лабораторных работ
  • неблокирующий экзамен
  • неблокирующий Лабораторная работа
  • блокирующий экзамен
  • блокирующий лабораторные работы
    5 лабораторных работ
  • неблокирующий экзамен
  • неблокирующий Лабораторная работа
  • блокирующий экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2020/2021 учебный год 2 модуль
    0.5 * лабораторные работы + 0.5 * экзамен
  • 2021/2022 учебный год 1 модуль
    0.5 * Лабораторная работа + 0.5 * экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Статистические методы анализа данных : учебник / Л.И. Ниворожкина, С.В. Арженовский, А.А. Рудяга [и др.] ; под общ. ред. д-ра экон. наук, проф. Л.И. Ниворожкиной. — М. : РИОР : ИНФРА-М, 2016. — 333 с. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/21064. - Режим доступа: http://znanium.com/catalog/product/556760
  • Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов и др. - М.: НИЦ ИНФРА-М, 2015. - 890 с.: 60x90 1/16 ISBN 978-5-16-103267-1 (online) - Режим доступа: http://znanium.com/catalog/product/515227

Рекомендуемая дополнительная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705

Авторы

  • Калягин Валерий Александрович
  • Гречихин Иван Сергеевич