• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Data Mining and Elements of Machine Learning

2021/2022
Учебный год
ENG
Обучение ведется на английском языке
3
Кредиты

Преподаватель


Дурандин Олег Владимирович

Course Syllabus

Abstract

The course introduces to the students some basic approaches and principles of data mining, the main methods of machine learning and the limits of these methods, the main methods of the quality evaluating
Learning Objectives

Learning Objectives

  • The purpose of the course is to familiarize students with the basic principles and methods of data analysis.
Expected Learning Outcomes

Expected Learning Outcomes

  • Able to train logistic regression and KNN, understand quality metrics.
  • Has an idea of classification based on decision trees and ensemble models, knows how to train them
  • Has an idea of classification based on SVM and various parameters of the model, is able to train the model
  • Has an understanding of the clustering problem and various algorithms, is able to train clustering models, understands clustering evaluation
  • Has an understanding of the spectrum of machine learning tasks
  • Has the idea of the "curse of dimensionality", is able to reduce the dimensionality with various methods
  • Is able to train polynomial regression and understand its quality metrics, to identify overfitting and underfitting, to estimate quality during cross-validation
  • Knows how to train linear regression, understands its quality metrics
  • Understands the most important principles of EDA, is able to prepare data for machine learning algorithms
Course Contents

Course Contents

  • Introduction. Examples of practical tasks.
  • (Exploratory Data Analysis (EDA)
  • Linear regression.
  • Polynomial regression. The concept of overfitting and regularization.
  • Classification problem. Logistic regression. The kNN algorithm.
  • Classification algorithms: decision trees and ensembles.
  • Support vector machine.
  • Unsupervised machine learning tasks. Dimension reduction.
  • Unsupervised machine learning tasks. The task of clustering.
Assessment Elements

Assessment Elements

  • non-blocking Laboratory work
  • non-blocking Control work
  • non-blocking Exam
    "Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе MS Teams (https://teams.microsoft.com). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка MS Teams. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи."
Interim Assessment

Interim Assessment

  • 2021/2022 3rd module
  • 2021/2022 4th module
    0.3 * Control work + 0.4 * Exam + 0.3 * Laboratory work
Bibliography

Bibliography

Recommended Core Bibliography

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)

Recommended Additional Bibliography

  • Рашка С. - Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения - Издательство "ДМК Пресс" - 2017 - ISBN: 978-5-97060-409-0 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/100905