• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Mining and Elements of Machine Learning

2021/2022
Academic Year
ENG
Instruction in English
3
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Elective course
When:
3 year, 3, 4 module

Instructor


Durandin, Oleg

Course Syllabus

Abstract

The course introduces to the students some basic approaches and principles of data mining, the main methods of machine learning and the limits of these methods, the main methods of the quality evaluation.
Learning Objectives

Learning Objectives

  • The purpose of the course is to familiarize students with the basic principles and methods of data analysis and machine learning
Expected Learning Outcomes

Expected Learning Outcomes

  • Able to train logistic regression and KNN, understand quality metrics.
  • Has an idea of classification based on decision trees and ensemble models, knows how to train them
  • Has an idea of classification based on SVM and various parameters of the model, is able to train the model
  • Has an understanding of the clustering problem and various algorithms, is able to train clustering models, understands clustering evaluation
  • Has an understanding of the spectrum of machine learning tasks
  • Has the idea of the "curse of dimensionality", is able to reduce the dimensionality with various methods
  • Is able to train polynomial regression and understand its quality metrics, to identify overfitting and underfitting, to estimate quality during cross-validation
  • Knows how to train linear regression, understands its quality metrics
  • Understands the most important principles of EDA, is able to prepare data for machine learning algorithms
Course Contents

Course Contents

  • Introduction. Examples of practical tasks.
  • Exploratory Data Analysis (EDA)
  • Linear regression
  • Polynomial regression. The concept of overfitting and regularization.
  • Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
  • Classification algorithms: decision trees and ensembles
  • Support vector machines
  • Unsupervised machine learning tasks. Dimension reduction
  • Unsupervised machine learning tasks. The task of clustering
Assessment Elements

Assessment Elements

  • non-blocking Laboratory work
  • non-blocking Control work
  • non-blocking Exam
    "Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе MS Teams (https://teams.microsoft.com). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка MS Teams. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи."
Interim Assessment

Interim Assessment

  • 2021/2022 4th module
    0.3 * Control work + 0.3 * Laboratory work + 0.4 * Exam
Bibliography

Bibliography

Recommended Core Bibliography

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)

Recommended Additional Bibliography

  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка ; перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.