We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis and Machine Learning

2024/2025
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Information Systems and Technologies (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
3 year, 2 module

Instructor

Программа дисциплины

Аннотация

Изучение дисциплины нацелено на освоение основных методов и алгоритмов машинного обучения и анализа данных с применением языка программирования Python. В результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных и реализовывать различные модели машинного обучения с использованием языка программирования Python. В курсе используются технологии ИИ. Курс предполагает прохождение on-line курса https://edu.hse.ru/course/view.php?id=151704
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения данной дисциплины является формирование у студентов представления об основных принципах обучения с учителем (например, задачи регрессии и классификации) и без учителя (например, задача кластеризации). А также умение применять сервисы ИИ и алгоритмы машинного обучения на практике, например в проектировании роботов (восприятие, контроль), анализе текстов (онлайн поиск, анти-спам), компьютерном зрении, медицинских информационных системах, обработке аудио, интеллектуальном анализе баз данных и других областях.
Планируемые результаты обучения

Планируемые результаты обучения

  • Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и иерархические методы) и метод главных компонент (PCA).
  • интерпретировать алгоритмы машинного обучения (с учителем, без учителя)
  • уметь интерпретировать задачу линейной регрессии и метрики качества
  • уметь интерпретировать задачу линейной регрессии с многими переменными. Применять полученные знания на практике.
  • интерпретировать задачи классификации (бинарная, множественная) и метрики качества для задач классификации
  • Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras
  • Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras для разных задач (регрессии, классификации)
  • Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и DBSCAN). Применять и сравнивать показатели качества для задачи кластеризации.
  • Интерпретировать задачи классификации (бинарная, множественная). Интерпретировать и применять на практике метрики качества для задач классификации (Accuracy, Precision, Recall, F1).
  • Уметь интерпретировать задачу сегментации. Интерпретировать и применять на практике основные метрики качества и нейронные сети для решения задачи сегментации (U-Net, SegNet).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Introduction. Examples of practical tasks.
  • Обзор основных алгоритмов машинного обучения, которые могут применяться в медицине. Задачи машинного обучения (регрессия, классификация, кластеризация).
  • Linear regression
  • Polynomial regression. The concept of overfitting and regularization.
  • Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
  • Classification algorithms: decision trees and ensembles
  • Unsupervised machine learning tasks. Dimension reduction
  • Метрики качества задачи кластеризации
  • Unsupervised machine learning tasks. The task of clustering
  • Нейронные сети.
  • Задача сегментации
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторные работы
  • неблокирующий Итоговый проект в области машинного обучения
  • неблокирующий Прохождение он-лайн курса
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.3 * Итоговый проект в области машинного обучения + 0.5 * Лабораторные работы + 0.2 * Прохождение он-лайн курса
Список литературы

Список литературы

Рекомендуемая основная литература

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
  • Neural Networks and Deep Learning - CCBY4_068 - Michael Nielson - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390854 - 390854 - iBOOKS

Рекомендуемая дополнительная литература

  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Частова Вероника Игоревна
  • Савченко Людмила Васильевна