• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Анализ данных

2024/2025
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Содержание дисциплины охватывает основные разделы статистики и включает знакомство с основными типами и особенностями статистических данных, освоение простейших методов их группировки и визуализации, изучение базовых инструментов предварительного анализа данных и способов выявления взаимосвязей. В результате освоения дисциплины студент должен понимать и использовать терминологию, принятую в анализе данных, применять релевантные статистические методы и инструменты при работе с данными в конкретных ситуациях, уметь интерпретировать полученные результаты и формулировать выводы на их основе. Итоговая оценка по дисциплине (оценка по промежуточной аттестации) рассчитывается на основе оценок по всем элементам контроля. Перечень элементов контроля и правила выставления итоговой оценки определены Программой дисциплины, размещенной в открытом доступе на корпоративном сайте (портале) НИУ ВШЭ.
Цель освоения дисциплины

Цель освоения дисциплины

  • Целями освоения дисциплины являются формирование у студентов навыков обработки и анализа данных с использованием основных статистических методов и релевантных средств программного обеспечения
Планируемые результаты обучения

Планируемые результаты обучения

  • Демонстрирует знание основных понятий, включенных в Тему 1, и умение ими оперировать. Ориентируется в основных источниках официальной статистической информации.
  • Демонстрирует знание основных понятий, включенных в Тему 2, и умение ими оперировать. Ориентируется в актуальных требованиях к предоставлению статистической отчетности.
  • Демонстрирует знание основных понятий, включенных в Тему 3, и умение ими оперировать. Решает задачи на нахождение различных типов средних величин,
  • Демонстрирует знание основных понятий, включенных в Тему 4, и умение ими оперировать. Решает задачи на вычисление и анализ показателей вариации.
  • Демонстрирует знание основных понятий, включенных в Тему 5, и умение ими оперировать. Решает задачи на определение ошибок выборки и ее необходимой численности.
  • Демонстрирует знание основных понятий, включенных в Тему 6, и умение ими оперировать. Решает задачи на выявление, определение тесноты и нахождение аналитического выражения корреляционной связи.
  • Демонстрирует знание основных понятий, включенных в Тему 7, и умение ими оперировать. Решает задачи на определение показателей динамики, выявление тенденций, сглаживание рядов динамики.
  • Демонстрирует знание основных понятий, включенных в Тему 8, и умение ими оперировать. Решает задачи на нахождение различных видов индексов.
  • Использует принятую терминологию
  • Выделяет отличительные особенности основных типов данных
  • Применяет релевантные методы для визуализации данных
  • Выбирает релевантные способы группировки данных
  • Использует подходящие методы для визуализации распределения данных
  • Рассчитывает основные меры центральной тенденции
  • Интерпретирует показатели центральной тенденции применительно к конкретным наборам данных
  • Рассчитывает основные меры вариативности
  • Интерпретирует показатели вариативности применительно к конкретным наборам данных
  • Использует способ z-оценки для получения стандартизированного распределения
  • Определяет выбросы в данных различными способами и использует подходящие способы их представления и обработки
  • Выявляет наличие пропусков в данных и использует подходящие методы их обработки
  • Анализирует данные на наличие корреляционных связей
  • Рассчитывает показатели корреляции и интерпретирует полученные результаты
  • Определяет параметры линейной регрессии
  • Оценивает качество полученных результатов регрессии
  • Интерпретирует результаты регрессионного анализа
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Сущность статистики как науки и как практической отрасли
  • Статистические данные, их особенности и основные способы представления
  • Генеральная совокупность и выборка
  • Сгруппированные данные, их особенности и способы представления
  • Меры центральной тенденции
  • Меры вариативности
  • Выбросы в данных, способы их определения и обработки
  • Пропуски в данных и способы их обработки
  • Корреляция, ее измерение и интерпретация
  • Линейная регрессия и метод наименьших квадратов
Элементы контроля

Элементы контроля

  • неблокирующий Мини-тесты
    Элемент контроля представляет собой тесты (планируемое количество 3 может быть незначительно изменено и, в зависимости от фактических условий реализации дисциплины, может составить от 2 до 4). Тесты проводятся во время лекций и выполняются в Smart LMS. Каждый тест может включать материал как изученных ранее тем, так и текущей лекции. Приблизительная длительность каждого теста 15 минут и может варьироваться в зависимости от объема и уровня сложности конкретного теста и типов вопросов. Точная длительность каждого теста объявляется студентам до его начала. Правила выполнения тестов размещаются в курсе на платформе Smart LMS.
  • неблокирующий Контрольная работа
    Контрольная работа выполняется онлайн в Smart LMS и подразумевает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Правила выполнения контрольной работы заблаговременно размещаются в курсе на платформе Smart LMS. Ориентировочная длительность работы 60 минут, точная длительность указывается в Правилах. О дате и времени проведения контрольной работы студенты информируются заблаговременно, не позднее недели, предшествующей написанию работы.
  • неблокирующий Тесты в онлайн-курсе
  • неблокирующий Экзамен
    Экзаменационная работа выполняется на компьютере в аудитории, в присутствии преподавателя и предполагает работу с набором данных. Средства обработки данных - Excel или Python - студент выбирает самостоятельно. Работа содержит задания, аналогичные заданиям, входившим в мини-тесты и контрольную работу. Возможно получение итоговой оценки "автоматом" без экзамена, список таких студентов заранее объявляется преподавателем. Для студентов, не получающих "автомат", экзамен является обязательным.
Промежуточная аттестация

Промежуточная аттестация

  • 2024/2025 3rd module
    0.4 * Контрольная работа + 0.2 * Мини-тесты + 0.1 * Тесты в онлайн-курсе + 0.3 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2020. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // ЭБС Юрайт [сайт]. — URL: http://biblio-online.ru/bcode/450166 (дата обращения: 31.08.2020).
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 448 с. — (Высшее образование). — ISBN 978-5-534-19964-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/557384 (дата обращения: 27.08.2024).
  • Анализ данных : учебник для вузов / В. С. Мхитарян [и др.] ; под редакцией В. С. Мхитаряна. — Москва : Издательство Юрайт, 2024. — 490 с. — (Высшее образование). — ISBN 978-5-534-00616-2. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/536007 (дата обращения: 27.08.2024).

Рекомендуемая дополнительная литература

  • Бизнес-статистика : учебник и практикум для вузов / И. И. Елисеева [и др.] ; под редакцией И. И. Елисеевой. — 2-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2024. — 444 с. — (Высшее образование). — ISBN 978-5-534-14822-0. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/537150 (дата обращения: 27.08.2024).
  • Козлов, А. Ю. Статистический анализ данных в MS Excel : учебное пособие / А.Ю. Козлов, В.С. Мхитарян, В.Ф. Шишов. — Москва : ИНФРА-М, 2023. — 320 с. — (Высшее образование: Бакалавриат). — DOI 10.12737/2842. - ISBN 978-5-16-004579-5. - Текст : электронный. - URL: https://znanium.com/catalog/product/1907518
  • Теория статистики : учебник / под ред. проф. Г.Л. Громыко. — 4-е изд., перераб. и доп. — Москва : ИНФРА-М, 2024. — 465 с. — (Высшее образование). - ISBN 978-5-16-019084-6. - Текст : электронный. - URL: https://znanium.com/catalog/product/2084150
  • Федоров, Д. Ю.  Программирование на python : учебное пособие для вузов / Д. Ю. Федоров. — 6-е изд., перераб. и доп. — Москва : Издательство Юрайт, 2025. — 187 с. — (Высшее образование). — ISBN 978-5-534-19666-5. — Текст : электронный // Образовательная платформа Юрайт [сайт]. — URL: https://urait.ru/bcode/556864 (дата обращения: 27.08.2024).

Авторы

  • Николаева Татьяна Павловна