We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Statistics for data analysis

2023/2024
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of Mathematical Economics (Faculty of Economics)
Course type:
Compulsory course
When:
3 year, 1 module

Instructor

Программа дисциплины

Аннотация

Курс знакомит студентов с основами статистики для анализа данных, студенты научатся делать описательный анализ данных, визуализировать данные и исследовать линейные взаимосвязи, что позволяет освоить уровень DC 0.0.2
Цель освоения дисциплины

Цель освоения дисциплины

  • Получить навыки первичной обработки данных, построения простых регрессионных моделей
Планируемые результаты обучения

Планируемые результаты обучения

  • Называет основные инструменты статистики для анализа данных, определяет типы данных, определяет пропуски данных, преобразует данные в необходимый формат
  • Разрабатывает код на Python, способный преобразовывать данные в необходимый формат. Комбинирует различные подходы для подготовки данных
  • Различает базовые статистические параметры, пишет код для описательной статистики и иерархии данных
  • Строит линейную регрессию, различает типы регрессий
  • Строит логистическую регрессию, использует байесовский подход. Оценивает качество построенных моделей
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Введение в статистический анализ данных
  • Переформатирование данных: очистка, преобразование, слияние, изменение формы
  • Вычисление описательных статистик
  • Проведение статистических экспериментов. Оценка значимости
  • Регрессия. Различные виды регрессий. Прогнозирование
  • Классификация данных
Элементы контроля

Элементы контроля

  • неблокирующий Проверка домашней работы
  • блокирует часть оценки/расчета Защита проекта
  • неблокирующий Активность
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 1 модуль
    0.3 * Активность + 0.5 * Защита проекта + 0.2 * Проверка домашней работы
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2023. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/511020 (дата обращения: 27.08.2024).
  • Маккинни, У. Python и анализ данных / У. Маккинни , перевод с английского А. А. Слинкина. — 2-ое изд., испр. и доп. — Москва : ДМК Пресс, 2020. — 540 с. — ISBN 978-5-97060-590-5. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/131721 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Глебов, В. И., Анализ данных в экономике. Сборник задач. : учебник / В. И. Глебов, С. Я. Криволапов. — Москва : КноРус, 2022. — 578 с. — ISBN 978-5-406-09169-2. — URL: https://book.ru/book/943011 (дата обращения: 27.08.2024). — Текст : электронный.
  • Демидова, Л. А. Интеллектуальный анализ данных на языке Python : учебно-методическое пособие / Л. А. Демидова. — Москва : РТУ МИРЭА, 2021. — 92 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/218693 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Авторы

  • Силаев Андрей Михайлович
  • Лапинова Светлана Александровна