• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Введение в Data Science

2019/2020
Учебный год
RUS
Обучение ведется на русском языке
3
Кредиты
Статус:
Курс обязательный
Когда читается:
1-й курс, 4 модуль

Преподаватель

Программа дисциплины

Аннотация

Целями освоения дисциплины «Введение в Data Science» являются формирование знаний, умений и навыков, а также развитие компетенций, необходимых для формирования у будущих менеджеров data-analytic thinking, с помощью которого они смогут получать знания и инсайт из данных. Фундаментальны принципы Data Science рассматриваются с точки зрения решения бизнес проблем. Данная дисциплина позволяет овладеть методами и программными средствами обработки деловой информации
Цель освоения дисциплины

Цель освоения дисциплины

  • Овладение методами и программными средствами обработки деловой информации;
  • Владение навыками работы с программным обеспечением для обработки и хранения данных.
  • Знакомство с примерами типовых задач, решаемых с помощью продвинутой аналитики
  • Знакомство с особенностями управления проектами и командами в сфере dats science
  • подбор адекватных методов для анализа деловой информации
Планируемые результаты обучения

Планируемые результаты обучения

  • Понимает этапы проекта, роли задачи и проблемы и инструменты на рынке больших данных
  • Рассматривает информационные системы в менеджменте как источники данных
  • Умеет подготавливать, форматировать и обрабатывать данные
  • Понимает что такое факторный, кластерный анализ сегментирование.
  • Понимает данные как важный компоненты управления.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Вводная часть
    Что такое Data Science. Примеры проектов из практической деятельности. Описание ролей и задействованных специалистов. Этапы проекта. Разбор примера плана проекта с указанием ролей, задач, проблем. Рынок данных. Юридические аспекты работы с данными. Инструменты аналитика — python, R, ноутбуки; SAS, SPSS, RapidMiner; библиотеки — какие и зачем; Hadoop,Spark.
  • Современные информационные технологии в бизнесе. Источники данных в бизнесе.
    Информационные системы в менеджменте как источники данных. Типы данных в информационных системах. Data Mining и Process Mining
  • Данные, базы данных, большие данные
    Данные как ключевой компонент в MIS. Базы данных, структура базы данных и системы управления базами данных (СУБД). Моделирование данных. Реляционные и иерархические базы данных. Нормализация. SQL. Выбор СУБД. Большие данные.
  • Возможности пакета EXCEL в обработке экономических данных.
    Меню и панели инструментов. Основные типы данных. Абсолютная и относительная адресация. Копирование. Работа с рядами. Форматы данных. Числовое форматирование. Создание пользовательских форматов. Форматирование таблицы. Основы визуализации данных. Типы диаграмм. График, точечная, гистограммы. Редактирование диаграмм Форматирование диаграмм.
  • Возможности пакета EXCEL для углубленной аналитики экономических данных.
    Функции и формулы в пакете Excel. Классы табличных функций: математические, статистические, логические, финансовые, даты и времени и др. Ввод функций и формул. Мастер функций. Редактирование формул. Кластерный анализ с использованием метода k-средних. Факторный анализ. Регрессионный анализ.
Элементы контроля

Элементы контроля

  • неблокирующий Практическая работы №3
  • неблокирующий Практические работа №1
  • неблокирующий Практическая работа №2
  • неблокирующий Практическая работа №4
  • неблокирующий Практическая работа №5
  • неблокирующий Домашнее задание
Промежуточная аттестация

Промежуточная аттестация

  • Промежуточная аттестация (4 модуль)
    0.25 * Практическая работа №2 + 0.25 * Практическая работа №4 + 0.25 * Практическая работы №3 + 0.25 * Практические работа №1
Список литературы

Список литературы

Рекомендуемая основная литература

  • Зараменских Е. П. - УПРАВЛЕНИЕ ЖИЗНЕННЫМ ЦИКЛОМ ИНФОРМАЦИОННЫХ СИСТЕМ. Учебник и практикум для академического бакалавриата - М.:Издательство Юрайт - 2019 - 431с. - ISBN: 978-5-9916-9200-7 - Текст электронный // ЭБС ЮРАЙТ - URL: https://urait.ru/book/upravlenie-zhiznennym-ciklom-informacionnyh-sistem-433676
  • Много цифр. Анализ больших данных при помощи Excel / Форман Д.; Пер. с англ. Соколовой А. - М.:Альпина Пабл., 2016. - 461 с.: 84x108 1/16 (Обложка) ISBN 978-5-9614-5032-3 - Режим доступа: http://znanium.com/catalog/product/551044
  • Статистический анализ данных в MS Excel : учеб. пособие / А.Ю. Козлов, В.С. Мхитарян, В.Ф. Шишов. — М. : ИНФРА-М, 2019. — 320 с. — (Высшее образование: Бакалавриат). — www.dx.doi.org/10.12737/2842. - Режим доступа: http://znanium.com/catalog/product/987337

Рекомендуемая дополнительная литература

  • Майер-Шенбергер В., Кукьер К. - Большие данные. Революция, которая изменит то, как мы живем, работаем и мыслим - Издательство "Манн, Иванов и Фербер" - 2014 - 240с. - ISBN: 978-5-91657-936-9 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/62171