We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Data Analysis

2024/2025
Academic Year
RUS
Instruction in Russian
3
ECTS credits

Instructor


Nikolaeva, Tatiana

Программа дисциплины

Аннотация

Содержание дисциплины охватывает основные разделы статистики и включает знакомство с основными типами и особенностями статистических данных, освоение простейших методов их группировки и визуализации, изучение базовых инструментов предварительного анализа данных и способов выявления взаимосвязей. В результате освоения дисциплины студент должен понимать и использовать терминологию, принятую в анализе данных, применять релевантные статистические методы и инструменты при работе с данными в конкретных ситуациях, уметь интерпретировать полученные результаты и формулировать выводы на их основе. Итоговая оценка по дисциплине (оценка по промежуточной аттестации) рассчитывается на основе оценок по всем элементам контроля. Перечень элементов контроля и правила выставления итоговой оценки определены Программой дисциплины, размещенной в открытом доступе на корпоративном сайте (портале) НИУ ВШЭ.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины являются формирование у студентов навыков обработки и анализа данных с использованием основных статистических методов и релевантных средств программного обеспечения
Планируемые результаты обучения

Планируемые результаты обучения

  • Демонстрирует знание основных понятий, включенных в Тему 1, и умение ими оперировать. Ориентируется в основных источниках официальной статистической информации.
  • Демонстрирует знание основных понятий, включенных в Тему 2, и умение ими оперировать. Ориентируется в актуальных требованиях к предоставлению статистической отчетности.
  • Демонстрирует знание основных понятий, включенных в Тему 3, и умение ими оперировать. Решает задачи на нахождение различных типов средних величин,
  • Демонстрирует знание основных понятий, включенных в Тему 4, и умение ими оперировать. Решает задачи на вычисление и анализ показателей вариации.
  • Демонстрирует знание основных понятий, включенных в Тему 5, и умение ими оперировать. Решает задачи на определение ошибок выборки и ее необходимой численности.
  • Демонстрирует знание основных понятий, включенных в Тему 6, и умение ими оперировать. Решает задачи на выявление, определение тесноты и нахождение аналитического выражения корреляционной связи.
  • Демонстрирует знание основных понятий, включенных в Тему 7, и умение ими оперировать. Решает задачи на определение показателей динамики, выявление тенденций, сглаживание рядов динамики.
  • Демонстрирует знание основных понятий, включенных в Тему 8, и умение ими оперировать. Решает задачи на нахождение различных видов индексов.
  • Использует принятую терминологию
  • Выделяет отличительные особенности основных типов данных
  • Применяет релевантные методы для визуализации данных
  • Выбирает релевантные способы группировки данных
  • Использует подходящие методы для визуализации распределения данных
  • Рассчитывает основные меры центральной тенденции
  • Интерпретирует показатели центральной тенденции применительно к конкретным наборам данных
  • Рассчитывает основные меры вариативности
  • Интерпретирует показатели вариативности применительно к конкретным наборам данных
  • Использует способ z-оценки для получения стандартизированного распределения
  • Определяет выбросы в данных различными способами и использует подходящие способы их представления и обработки
  • Выявляет наличие пропусков в данных и использует подходящие методы их обработки
  • Анализирует данные на наличие корреляционных связей
  • Рассчитывает показатели корреляции и интерпретирует полученные результаты
  • Определяет параметры линейной регрессии
  • Оценивает качество полученных результатов регрессии
  • Интерпретирует результаты регрессионного анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Сущность статистики как науки и как практической отрасли
  • Статистические данные, их особенности и основные способы представления
  • Генеральная совокупность и выборка
  • Сгруппированные данные, их особенности и способы представления
  • Меры центральной тенденции
  • Меры вариативности
  • Выбросы в данных, способы их определения и обработки
  • Пропуски в данных и способы их обработки
  • Корреляция, ее измерение и интерпретация
  • Линейная регрессия и метод наименьших квадратов
Элементы контроля

Элементы контроля

  • неблокирующий Мини-тесты
    Элемент контроля представляет собой тесты (планируемое количество 3 может быть незначительно изменено и, в зависимости от фактических условий реализации дисциплины, может составить от 2 до 4). Тесты проводятся во время лекций и выполняются в Smart LMS. Каждый тест может включать материал как изученных ранее тем, так и текущей лекции. Приблизительная длительность каждого теста 15 минут и может варьироваться в зависимости от объема и уровня сложности конкретного теста и типов вопросов. Точная длительность каждого теста объявляется студентам до его начала. Правила выполнения тестов размещаются в курсе на платформе Smart LMS.
  • неблокирующий Контрольная работа
    Контрольная работа выполняется онлайн в Smart LMS и подразумевает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Правила выполнения контрольной работы заблаговременно размещаются в курсе на платформе Smart LMS. Ориентировочная длительность работы 60 минут, точная длительность указывается в Правилах. О дате и времени проведения контрольной работы студенты информируются заблаговременно, не позднее недели, предшествующей написанию работы.
  • неблокирующий Тесты в онлайн-курсе
  • неблокирующий Экзамен
    Экзаменационная работа выполняется на компьютере в аудитории, в присутствии преподавателя и предполагает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Работа содержит задания, аналогичные заданиям, входившим в мини-тесты и контрольную работу. Возможно получение итоговой оценки "автоматом" без экзамена, список таких студентов заранее объявляется преподавателем. Для студентов, не получающих "автомат", экзамен является обязательным.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.4 * Контрольная работа + 0.2 * Мини-тесты + 0.1 * Тесты в онлайн-курсе + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: http://biblio-online.ru/bcode/450166 (дата обращения: 31.08.2020).
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 448 с. — (Высшее образование). — ISBN 978-5-534-19964-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/557384 (дата обращения: 27.08.2024).
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/536007 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Бизнес-статистика : учебник и практикум для вузов / И. И. Елисеева [и др.] ; под редакцией И. И. Елисеевой. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 444 с. — (Высшее образование). — ISBN 978-5-534-14822-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/537150 (дата обращения: 27.08.2024).
  • Козлов, А. Ю. Статистический анализ данных в MS Excel : учебное пособие / А.Ю. Козлов, В.С. Мхитарян, В.Ф. Шишов. — Москва : ИНФРА-М, 2023. — 320 с. — (Высшее образование: Бакалавриат). — DOI 10.12737/2842. - ISBN 978-5-16-004579-5. - Текст : электронный. - URL: https://znanium.com/catalog/product/1907518
  • Теория статистики : учебник / под ред. проф. Г.Л. Громыко. — 4-е изд., перераб. и доп. — Москва : ИНФРА-М, 2024. — 465 с. — (Высшее образование). - ISBN 978-5-16-019084-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/2084150
  • Федоров, Д. Ю.  Программирование на python : учебное пособие для вузов / Д. Ю. Федоров. — 6-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2025. — 187 с. — (Высшее образование). — ISBN 978-5-534-19666-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/556864 (дата обращения: 27.08.2024).

Авторы

  • Николаева Татьяна Павловна