• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Глава в книге
ALOE: Boosting Large Language Model Fine-Tuning with Aggressive Loss-Based Elimination of Samples

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

In bk.: Frontiers in Artificial Intelligence and Applications: 27th European Conference on Artificial Intelligence, 19–24 October 2024, Santiago de Compostela, Spain. Vol. 392. IOS Press Ebooks, 2024. P. 3980-3986.

Препринт
DAREL: Data Reduction with Losses for Training Acceleration of Real and Hypercomplex Neural Networks

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

NeurIPS 2023 Workshop. ZmuLcqwzkl. OpenReview, 2023

Data Mining and Elements of Machine Learning

2021/2022
Учебный год
ENG
Обучение ведется на английском языке
3
Кредиты

Преподаватель

Дурандин Олег Владимирович

Дурандин Олег Владимирович

Course Syllabus

Abstract

The course introduces to the students some basic approaches and principles of data mining, the main methods of machine learning and the limits of these methods, the main methods of the quality evaluation.
Learning Objectives

Learning Objectives

  • The purpose of the course is to familiarize students with the basic principles and methods of data analysis and machine learning
Expected Learning Outcomes

Expected Learning Outcomes

  • Able to train logistic regression and KNN, understand quality metrics.
  • Has an idea of classification based on decision trees and ensemble models, knows how to train them
  • Has an idea of classification based on SVM and various parameters of the model, is able to train the model
  • Has an understanding of the clustering problem and various algorithms, is able to train clustering models, understands clustering evaluation
  • Has an understanding of the spectrum of machine learning tasks
  • Has the idea of the "curse of dimensionality", is able to reduce the dimensionality with various methods
  • Is able to train polynomial regression and understand its quality metrics, to identify overfitting and underfitting, to estimate quality during cross-validation
  • Knows how to train linear regression, understands its quality metrics
  • Understands the most important principles of EDA, is able to prepare data for machine learning algorithms
Course Contents

Course Contents

  • Introduction. Examples of practical tasks.
  • Exploratory Data Analysis (EDA)
  • Linear regression
  • Polynomial regression. The concept of overfitting and regularization.
  • Classification problem. Logistic regression. The KNN algorithm. Naïve Bayes Classifier.
  • Classification algorithms: decision trees and ensembles
  • Support vector machines
  • Unsupervised machine learning tasks. Dimension reduction
  • Unsupervised machine learning tasks. The task of clustering
Assessment Elements

Assessment Elements

  • non-blocking Laboratory work
  • non-blocking Control work
  • non-blocking Exam
    "Экзамен проводится в устной форме (опрос по материалам курса). Экзамен проводится на платформе MS Teams (https://teams.microsoft.com). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка MS Teams. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи."
Interim Assessment

Interim Assessment

  • 2021/2022 4th module
    0.3 * Control work + 0.3 * Laboratory work + 0.4 * Exam
Bibliography

Bibliography

Recommended Core Bibliography

  • Muller, A. C., & Guido, S. (2017). Introduction to machine learning with Python: a guide for data scientists. O’Reilly Media. (HSE access: http://ebookcentral.proquest.com/lib/hselibrary-ebooks/detail.action?docID=4698164)

Recommended Additional Bibliography

  • Рашка, С. Python и машинное обучение: крайне необходимое пособие по новейшей предсказательной аналитике, обязательное для более глубокого понимания методологии машинного обучения : руководство / С. Рашка ; перевод с английского А. В. Логунова. — Москва : ДМК Пресс, 2017. — 418 с. — ISBN 978-5-97060-409-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100905 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.