We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis in Python

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits
Delivered at:
Department of General and Strategic Management (Nizhny Novgorod) (Faculty of Management (Nizhny Novgorod))
Course type:
Compulsory course
When:
3 year, 1, 2 module

Instructor

Программа дисциплины

Аннотация

Курс по анализу данных на Python представляет собой обширное обучение, нацеленное на развитие навыков работы с данными и аналитическими методами с помощью языка программирования Python. Курс включает в себя теоретические аспекты анализа данных, практические занятия и реальные проекты, которые помогут студентам приобрести необходимые навыки для решения задач анализа данных в различных областях.В ходе курса студенты изучают основы работы с данными, такие как обработка и преобразование данных, визуализация данных, статистический анализ и машинное обучение. Они также ознакомятся с различными библиотеками Python, такими как Pandas, NumPy, Matplotlib и Scikit-learn, которые являются основными инструментами для анализа данных на этом языке программирования.
Цель освоения дисциплины

Цель освоения дисциплины

  • Научить студентов основным навыкам программирования на языке Python. Научить студентов основным методам извлечения и обработки данных, необходимым для дальнейшего обучения и работы по специальности. Познакомить студентов с основными концепциями и методами анализа данных, статистики и машинного обучения.
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает, чем наука о данных отличается от машинного обучения и статистики
  • Владеть: навыками применения библиотеки Pandas при решении практических задач.
  • Знать особенности работы с современными дистрибутивами Python
  • Понимать принципы визуализация данных и построения эффективных панелей индикаторов
  • Владеет базовыми навыками работы с данными: агрегированием, фильтрацией, созданием новых переменных, работой со сводными таблицами.
  • Владеет процедурой обнаружения пропущенных значений. Умеет работать с пропущенными значениями: удаление и стратегии замены.
  • Знает типы переменных. Знает меры центральной тенденции и разброса. Знает процедуру обнаружения выбросов. Умеет обрабатывать выбросы.
  • Уметь применять машинное обучение для решения задач анализа данных
  • Студент понимает роль Data Science в стратегическом развитии бизнеса.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Интро
  • Инструменты для работы с данными в Python
  • Типы переменных
  • Работа с данными
  • Визуализация
  • Машинное обучение
Элементы контроля

Элементы контроля

  • неблокирующий Практическое задание
    Создание аналитического отчета по датасету и ответ на вопросы Критерии оценивания: Точность кода, оформление, полноту выполненных заданий, адекватность визуализаций и глубину аналитики. Важно, каждый ваш шаг снабжать текстом, чтобы не было голого кода, объясняйте что вы делаете и если вы получили что-то, что нужно анализировать, то дайте мне этот анализ в виде текста.
  • неблокирующий ТЕСТ
    Тест из курса по подготовке к экзамену
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 1st module
    1 * ТЕСТ
  • 2024/2025 2nd module
    1 * Практическое задание
Список литературы

Список литературы

Рекомендуемая основная литература

  • Data Science : наука о данных с нуля, Грас, Дж., 2018
  • Data Science. Наука о данных с нуля: Пер. с англ. — 2-е изд., перераб. и доп. - 978-5-9775-6731-2 - Грас Д. - 2021 - Санкт-Петербург: БХВ-Петербург - https://ibooks.ru/bookshelf/356414 - 356414 - iBOOKS
  • Маккинни, У. Python и анализ данных. Первичная обработка данных с применением pandas, NumPy и Jupiter : справочник / У. Маккинни , перевод с английского А. А. Слинкина. — 3-е изд. — Москва : ДМК Пресс, 2023. — 536 с. — ISBN 978-5-93700-174-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/348086 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.

Рекомендуемая дополнительная литература

  • Теоретический минимум по Big Data : все, что нужно знать о больших данных, Ын, А., 2019

Авторы

  • Белохлебова Наталья Александровна
  • Привалов Игорь Васильевич