• A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis and Management

2025/2026
Academic Year
RUS
Instruction in Russian
6
ECTS credits
Delivered at:
Department of Information Systems and Technologies (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
1 year, 1, 2 module

Программа дисциплины

Аннотация

Дисциплина охватывает методы сбора, хранения, обработки и анализа данных, включая проектирование баз данных, обеспечение их качества и защиту. Основное внимание уделяется ETL-процессам (извлечение, преобразование, загрузка), моделированию данных, работе с хранилищами и применению аналитических инструментов
Цель освоения дисциплины

Цель освоения дисциплины

  • Студент сможет извлекать данные из различных источников (базы данных, API, файлы) с использованием соответствующих инструментов и методов.
  • Студент сможет проводить разведочный анализ данных (EDA) для формулирования гипотез и выявления ключевых факторов, влияющих на изучаемые явления.
  • Студент сможет оценивать производительность моделей машинного обучения с использованием различных метрик (точность, прецизионность, полнота, RMSE).
  • Студент сможет описывать и применять процессы ETL (извлечение, преобразование, загрузка) для переноса данных из различных источников в хранилища данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент сможет описывать и применять процессы ETL (извлечение, преобразование, загрузка) для переноса данных из различных источников в хранилища данных.
  • Студент сможет строить и обучать модели машинного обучения (регрессия, классификация, кластеризация) с использованием соответствующих библиотек и инструментов.
  • Студент сможет создавать различные типы визуализаций данных (графики, диаграммы, тепловые карты) для выявления закономерностей и трендов.
  • Студент сможет преобразовывать данные в подходящий для анализа формат, используя методы агрегирования, фильтрации и нормализации.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Управление данными и управление качеством данных
  • Анализ и исследование данных
  • Сбор и предварительная обработка данных
  • Моделирование данных и машинное обучение
Элементы контроля

Элементы контроля

  • неблокирующий Homework
  • неблокирующий Defence
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.4 * Defence + 0.3 * Homework + 0.3 * Homework
Список литературы

Список литературы

Рекомендуемая основная литература

  • Microsoft Excel : анализ данных и построение бизнес - моделей, Винстон, Уэйн Л., 2005
  • Python и анализ данных, Маккинни, У., 2015
  • Анализ данных : Статистические и вычислительные методы для научных работников и инженеров, Брандт, З., 2003
  • Анализ данных : учебник для вузов / под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2025. — 448 с. — (Высшее образование). — ISBN 978-5-534-19964-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/560311 (дата обращения: 04.07.2025).
  • Анализ данных : учебник для вузов, , 2024
  • Ковалева, М. А., Анализ данных : учебное пособие / М. А. Ковалева, Р. И. Бтемирова. — Москва : Русайнс, 2020. — 62 с. — ISBN 978-5-4365-6099-1. — URL: https://book.ru/book/938733 (дата обращения: 04.07.2025). — Текст : электронный.
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Тихомиров, Д. А., Анализ данных (с применением программы SPSS) : учебник / Д. А. Тихомиров. — Москва : КноРус, 2022. — 244 с. — ISBN 978-5-406-09208-8. — URL: https://book.ru/book/942678 (дата обращения: 04.07.2025). — Текст : электронный.

Рекомендуемая дополнительная литература

  • Apache Kafka. Потоковая обработка и анализ данных - 978-5-4461-0575-5 - Нархид Ния, Шапира Гвен, Палино Тодд - 2019 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/358152 - 358152 - iBOOKS
  • Excel 2007. Анализ данных и бизнес-моделирование, Винстон, У.Л., 2008
  • Кондрашов, Ю. Н., Анализ данных и машинное обучение на платформе MS SQL Server : учебное пособие / Ю. Н. Кондрашов. — Москва : Русайнс, 2024. — 303 с. — ISBN 978-5-466-06473-5. — URL: https://book.ru/book/953643 (дата обращения: 04.07.2025). — Текст : электронный.

Авторы

  • Частова Вероника Игоревна