• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Контакты
Заведующий кафедрой Асеева Наталья Владимировна

E-mail: naseeva@hse.ru

Осипова Анастасия Ивановна
Менеджер Осипова Анастасия Ивановна

E-mail: aiosipova@hse.ru

603093 Н.Новгород,ул. Родионова, 136

603095 Н.Новгород,ул. Львовская, 1В

603155 Н.Новгород,ул. Б.Печерская, д.25/12

Книга
Компьютерные средства лингвистического исследования. Лабораторные работы

Демидовский А. В., Зайцева В. В.

Нижегородский государственный технический университет им. Р.Е. Алексеева, 2025.

Статья
Method of voice source coding with data compression based on the linear prediction model

Savchenko L., Savchenko V.

Measurement Techniques. 2025. Vol. 74. No. 3. P. 67-78.

Глава в книге
MADD: Multi-Agent Drug Discovery Orchestra

Solovev G. V., Zhidkovskaya A. B., Orlova A. et al.

In bk.: Findings of the Association for Computational Linguistics: EMNLP 2025. Association for Computational Linguistics, 2025. Ch. 367. P. 6956-6998.

Препринт
DAREL: Data Reduction with Losses for Training Acceleration of Real and Hypercomplex Neural Networks

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

NeurIPS 2023 Workshop. ZmuLcqwzkl. OpenReview, 2023

Анализ и управление данными

2025/2026
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты

Программа дисциплины

Аннотация

Дисциплина охватывает методы сбора, хранения, обработки и анализа данных, включая проектирование баз данных, обеспечение их качества и защиту. Основное внимание уделяется ETL-процессам (извлечение, преобразование, загрузка), моделированию данных, работе с хранилищами и применению аналитических инструментов
Цель освоения дисциплины

Цель освоения дисциплины

  • Студент сможет извлекать данные из различных источников (базы данных, API, файлы) с использованием соответствующих инструментов и методов.
  • Студент сможет проводить разведочный анализ данных (EDA) для формулирования гипотез и выявления ключевых факторов, влияющих на изучаемые явления.
  • Студент сможет оценивать производительность моделей машинного обучения с использованием различных метрик (точность, прецизионность, полнота, RMSE).
  • Студент сможет описывать и применять процессы ETL (извлечение, преобразование, загрузка) для переноса данных из различных источников в хранилища данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Студент сможет описывать и применять процессы ETL (извлечение, преобразование, загрузка) для переноса данных из различных источников в хранилища данных.
  • Студент сможет строить и обучать модели машинного обучения (регрессия, классификация, кластеризация) с использованием соответствующих библиотек и инструментов.
  • Студент сможет создавать различные типы визуализаций данных (графики, диаграммы, тепловые карты) для выявления закономерностей и трендов.
  • Студент сможет преобразовывать данные в подходящий для анализа формат, используя методы агрегирования, фильтрации и нормализации.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Управление данными и управление качеством данных
  • Анализ и исследование данных
  • Сбор и предварительная обработка данных
  • Моделирование данных и машинное обучение
Элементы контроля

Элементы контроля

  • неблокирующий Homework
  • неблокирующий Defence
Промежуточная аттестация

Промежуточная аттестация

  • 2025/2026 2nd module
    0.4 * Defence + 0.3 * Homework + 0.3 * Homework
Список литературы

Список литературы

Рекомендуемая основная литература

  • Microsoft Excel : анализ данных и построение бизнес - моделей, Винстон, Уэйн Л., 2005
  • Python и анализ данных, Маккинни, У., 2015
  • Анализ данных : Статистические и вычислительные методы для научных работников и инженеров, Брандт, З., 2003
  • Анализ данных : учебник для вузов / под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2025. — 448 с. — (Высшее образование). — ISBN 978-5-534-19964-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/560311 (дата обращения: 04.07.2025).
  • Анализ данных : учебник для вузов, , 2024
  • Ковалева, М. А., Анализ данных : учебное пособие / М. А. Ковалева, Р. И. Бтемирова. — Москва : Русайнс, 2020. — 62 с. — ISBN 978-5-4365-6099-1. — URL: https://book.ru/book/938733 (дата обращения: 04.07.2025). — Текст : электронный.
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Тихомиров, Д. А., Анализ данных (с применением программы SPSS) : учебник / Д. А. Тихомиров. — Москва : КноРус, 2022. — 244 с. — ISBN 978-5-406-09208-8. — URL: https://book.ru/book/942678 (дата обращения: 04.07.2025). — Текст : электронный.

Рекомендуемая дополнительная литература

  • Apache Kafka. Потоковая обработка и анализ данных - 978-5-4461-0575-5 - Нархид Ния, Шапира Гвен, Палино Тодд - 2019 - Санкт-Петербург: Питер - https://ibooks.ru/bookshelf/358152 - 358152 - iBOOKS
  • Excel 2007. Анализ данных и бизнес-моделирование, Винстон, У.Л., 2008
  • Кондрашов, Ю. Н., Анализ данных и машинное обучение на платформе MS SQL Server : учебное пособие / Ю. Н. Кондрашов. — Москва : Русайнс, 2024. — 303 с. — ISBN 978-5-466-06473-5. — URL: https://book.ru/book/953643 (дата обращения: 04.07.2025). — Текст : электронный.

Авторы

  • Частова Вероника Игоревна