• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Introduction to Machine Learning

2021/2022
Academic Year
RUS
Instruction in Russian
8
ECTS credits

Instructor

Программа дисциплины

Аннотация

Not so long ago, the term "big data" has become widespread, designating a new applied area - the search for ways to automatically quickly analyze huge amounts of heterogeneous information. Big data science is still taking shape, but it is already in great demand - and in the future it will only be in demand more. With its help, you can solve incredible tasks: assess the state of the liver using a cardiogram, predict salary based on a job description, offer music to a user based on his profile on the Internet. Big data can be anything: the results of scientific experiments, bank transaction logs, meteorological observations, social media profiles - in short, anything that can be useful to analyze. The most promising approach to big data analysis is considered to be the use of machine learning - a set of methods thanks to which a computer can find initially unknown relationships and patterns in arrays. There are people at the HSE Faculty of Computer Science and at the School of Data Analysis who are actively using machine learning and developing new approaches to it. They are the teachers of this course. You will learn the basic types of problems solved by machine learning - mainly about classification, regression, and clustering. Learn about the basic methods of machine learning and their features, learn how to evaluate the quality of models - and decide if a model is suitable for solving a specific problem. Finally, get acquainted with modern libraries that implement the discussed models and methods for assessing their quality. For work, we will use real data from real tasks.
Цель освоения дисциплины

Цель освоения дисциплины

  • Освоение базовых алгоритмов машинного обучения, позволяющих решать различные задачи анализа данных.
  • Освоение библиотек языка python, в которых реализованы различные алгоритмы машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Решает задачи и доказывает утверждения по теме модуля
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Introduction. Objects similarity measure. Введение. Мера близости объектов
  • K-means clustering. Hierarchical clustering. Алгоритм k средних. Иерархические методы кластеризации
  • Density based clustering. Grid based clus-tering. Алгоритмы кластеризации, основанные на плотности. Алгоритмы кластеризации, ос-нованные на сетке.
  • Clustering validation. Методы оценки качества кластеризации
Элементы контроля

Элементы контроля

  • блокирующий Письменная работа 60 минут
  • блокирующий Аудиторная оценка
  • блокирующий Письменная работа 60 минут
  • блокирующий Аудиторная оценка
Промежуточная аттестация

Промежуточная аттестация

  • 2021/2022 учебный год 3 модуль
    0.2 * Письменная работа 60 минут + 0.2 * Письменная работа 60 минут + 0.3 * Аудиторная оценка + 0.3 * Аудиторная оценка
Список литературы

Список литературы

Рекомендуемая основная литература

  • Haroon, D. (2017). Python Machine Learning Case Studies : Five Case Studies for the Data Scientist. [Berkeley, CA]: Apress. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1623520

Рекомендуемая дополнительная литература

  • Baka, B. (2017). Python Data Structures and Algorithms. Birmingham, U.K.: Packt Publishing. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=1528144
  • Bill Lubanovic. (2019). Introducing Python : Modern Computing in Simple Packages. [N.p.]: O’Reilly Media. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=2291494