• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ данных и машинное обучение

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Изучение дисциплины нацелено на освоение основных методов и алгоритмов машинного обучения и анализа данных с применением языка программирования Python. В результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных и реализовывать различные модели машинного обучения с использованием языка программирования Python. В курсе используются технологии ИИ. Курс предполагает прохождение on-line курса https://edu.hse.ru/course/view.php?id=151704
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения данной дисциплины является формирование у студентов представления об основных принципах обучения с учителем (например, задачи регрессии и классификации) и без учителя (например, задача кластеризации). А также умение применять сервисы ИИ и алгоритмы машинного обучения на практике, например в проектировании роботов (восприятие, контроль), анализе текстов (онлайн поиск, анти-спам), компьютерном зрении, медицинских информационных системах, обработке аудио, интеллектуальном анализе баз данных и других областях.
Планируемые результаты обучения

Планируемые результаты обучения

  • Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и иерархические методы) и метод главных компонент (PCA).
  • интерпретировать алгоритмы машинного обучения (с учителем, без учителя)
  • уметь интерпретировать задачу линейной регрессии и метрики качества
  • уметь интерпретировать задачу линейной регрессии с многими переменными. Применять полученные знания на практике.
  • интерпретировать задачи классификации (бинарная, множественная) и метрики качества для задач классификации
  • Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras
  • Интерпретировать нейронные сети, уметь применять на практике нейронные сети из библиотеки Keras для разных задач (регрессии, классификации)
  • Интерпретировать задачу кластеризации. Применять на практике основные алгоритмы кластеризации (k-means и DBSCAN). Применять и сравнивать показатели качества для задачи кластеризации.
  • Интерпретировать задачи классификации (бинарная, множественная). Интерпретировать и применять на практике метрики качества для задач классификации (Accuracy, Precision, Recall, F1).
  • Уметь интерпретировать задачу сегментации. Интерпретировать и применять на практике основные метрики качества и нейронные сети для решения задачи сегментации (U-Net, SegNet).
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Introduction. Examples of practical tasks.
  • Обзор основных алгоритмов машинного обучения, которые могут применяться в медицине. Задачи машинного обучения (регрессия, классификация, кластеризация).
  • Linear regression
  • Polynomial regression. The concept of overfitting and regularization.
  • Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
  • Classification algorithms: decision trees and ensembles
  • Unsupervised machine learning tasks. Dimension reduction
  • Метрики качества задачи кластеризации
  • Unsupervised machine learning tasks. The task of clustering
  • Нейронные сети.
  • Задача сегментации
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторные работы
  • неблокирующий Итоговый проект в области машинного обучения
  • неблокирующий Прохождение он-лайн курса
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.3 * Итоговый проект в области машинного обучения + 0.5 * Лабораторные работы + 0.2 * Прохождение он-лайн курса
Список литературы

Список литературы

Рекомендуемая основная литература

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)
  • Neural Networks and Deep Learning - CCBY4_068 - Michael Nielson - 2022 - Open Educational Resources: libretexts.org - https://ibooks.ru/bookshelf/390854 - 390854 - iBOOKS

Рекомендуемая дополнительная литература

  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка , перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Савченко Людмила Васильевна
  • Частова Вероника Игоревна