We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
3 year, 1, 2 module

Instructor


Shimko, Aleksei

Программа дисциплины

Аннотация

Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
  • Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
  • Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает и умеет использовать программные реализации методов решения задачи классификации
  • Знает и умеет использовать программные реализации методов решения задачи регрессии
  • Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
  • Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
  • Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
  • Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Понимает концепцию задачи классификации как задачи машинного обучения
  • Понимает концепцию задачи регрессии как задачи машинного обучения
  • Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
  • Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
  • Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Первичный анализ данных
  • Методы кластеризации
  • Методы предсказания. Регрессия
  • Методы классификации
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа
  • неблокирующий Практическая работа
  • неблокирующий Экзамен
  • неблокирующий Домашнее задание
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 2nd module
    0.2 * Домашнее задание + 0.2 * Лабораторная работа + 0.2 * Практическая работа + 0.4 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.

Авторы

  • Асеева Наталья Владимировна