• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis and Data Mining

2024/2025
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
4 year, 1, 2 module

Программа дисциплины

Аннотация

The course is aimed at training specialists capable of carrying out mathematical modeling of a subject area and solving applied problems of information processing at a high technical level. The problems of natural language processing are considered using deep learning methods using transformers and generative adversarial networks. Practical exercises serve to obtain stable natural language processing skills using modern high-level programming languages. . Для выполнения заданий используется скриптовый язык Pyhton 3, а также технологическая платформа Anaconda 4. To complete tasks, the scripting language Pyhton 3 is used, as well as the technology platform Anaconda 4. To master the academic discipline, students must have the following knowledge and competencies: modern methods of designing and implementing information systems; basic algorithms and data structures for quick information retrieval; • programming in C, C++ languages.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целью освоения дисциплины «Анализ и разработка данных» является получение высшего профессионально профилированного (на уровне бакалавра) образования, позволяющего выпускнику успешно работать в избранной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мо-бильности и устойчивости на рынке труда.
  • Целью освоения дисциплины «Анализ и разработка данных» является получение высшего профессионально профилированного (на уровне бакалавра) образования, позволяющего выпускнику успешно работать в избранной сфере деятельности, обладать универсальными и предметно-специализированными компетенциями, способствующими его социальной мобильности и устойчивости на рынке труда.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знание алгоритмов классификации на основе ансамблей простейших алгоритмов
  • Знание задачи и алгоритмов кластеризации
  • Знание простейших алгоритмов классификации
  • Изучение техники сокращения размерности
  • Ознакомление с задачами регресии и способами их решения
  • Ознакомление с задачей классификации
  • Понимание основ работы с данными
  • Умение готовить данные для обучения и поддерживать процесс обучения
  • Знакомство с нейронными сетями
  • Знание известных архитектур классификации изображений
  • Знание последних результатов в области глубокого обучения
  • Понимание математических основ алгоритма обратного распространения ошибок
  • Понимание уязвимых мест нейронных сетей и возможных проблем в их работе
  • Понимание целей использования свёрточных и рекуррентных слоёв нейронной сети
  • Умение создавать архитектуры нейронных сетей и настраивать их для поставленных целей
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Нейронные сети: основы
  • Нейронные сети: настройка
  • Архитектуры нейронных сетей
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работа 1
  • неблокирующий Лабораторная работа 1
  • неблокирующий Практическая работа 2
  • неблокирующий Лабораторная работа 2
  • неблокирующий Экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.24 * Лабораторная работа 1 + 0.24 * Лабораторная работа 2 + 0.06 * Практическая работа 1 + 0.06 * Практическая работа 2 + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Статистические методы анализа данных : учебник / Л.И. Ниворожкина, С.В. Арженовский, А.А. Рудяга [и др.] ; под общ. ред. д-ра экон. наук, проф. Л.И. Ниворожкиной. — М. : РИОР : ИНФРА-М, 2016. — 333 с. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/21064. - Режим доступа: http://znanium.com/catalog/product/556760
  • Статистический анализ данных, моделирование и исследование вероятностных закономерностей. Компьютерный подход / Б.Ю. Лемешко, С.Б. Лемешко, С.Н. Постовалов и др. - М.: НИЦ ИНФРА-М, 2015. - 890 с.: 60x90 1/16 ISBN 978-5-16-103267-1 (online) - Режим доступа: http://znanium.com/catalog/product/515227

Рекомендуемая дополнительная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705

Авторы

  • Казаков Максим Анатольевич
  • Трехлеб Ольга Юрьевна
  • Колданов Петр Александрович