• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Книга
Integral Robot Technologies and Speech Behavior

Kharlamov A. A., Pantiukhin D., Borisov V. et al.

Newcastle upon Tyne: Cambridge Scholars Publishing, 2024.

Статья
Clique detection with a given reliability

Semenov D., Koldanov A. P., Koldanov P. et al.

Annals of Mathematics and Artificial Intelligence. 2024.

Глава в книге
Neural Networks for Speech Synthesis of Voice Assistants and Singing Machines

Pantiukhin D.

In bk.: Integral Robot Technologies and Speech Behavior. Newcastle upon Tyne: Cambridge Scholars Publishing, 2024. Ch. 9. P. 281-296.

Препринт
DAREL: Data Reduction with Losses for Training Acceleration of Real and Hypercomplex Neural Networks

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

NeurIPS 2023 Workshop. ZmuLcqwzkl. OpenReview, 2023

Введение в анализ данных

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
5
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Изучение дисциплины «Введение в анализ данных» нацелено на освоение основных методов и алгоритмов анализа данных с применением языка программирования Python.Курс является вторым в майноре «Интеллектуальный анализ данных». Предполагается, что в результате освоения курса студенты будут способны самостоятельно проводить анализ различных наборов данных с использованием языка программирования Python.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знать основные методы анализа данных; о месте и ценности методов машинного обучения и разработки данных в современной науке и практической деятельности; основные каналы научной и прикладной информации по анализу данных
  • Уметь использовать освоенные методы анализа данных для обработки конкретных наборов данных, анализировать результаты, делать выводы; формализовать конкретную задачу анализа данных и разработать алгоритм решения
  • Владеть методами программирования, отлаживания и тестирования алгоритмов анализа данных
Планируемые результаты обучения

Планируемые результаты обучения

  • Знает и умеет использовать программные реализации методов решения задачи классификации
  • Знает и умеет использовать программные реализации методов решения задачи регрессии
  • Знает и умеет использовать программные реализации основных алгоритмов кластерного анализа
  • Знает основные методы кластерного анализа данных, основные способы измерения расстояния между объектами
  • Знает основные методы решения задачи классификации, способы оценки точности классификации, способы борьбы с переобучением
  • Знает основные методы решения задачи регрессии, способы оценки ошибки предсказания
  • Знает основные типы данных, этапы предобработки данных, методы разведочного анализа данных
  • Понимает концепцию задачи классификации как задачи машинного обучения
  • Понимает концепцию задачи регрессии как задачи машинного обучения
  • Понимает концепцию кластерного анализа данных, концепцию близкости (похожести) объектов
  • Понимает концепцию структурированных и не структурированных данных, задачу анализа данных и машинного обучения
  • Умеет выполнять предобработку данных и разведочный анализ данных с помощью релевантного программного обеспечения
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Первичный анализ данных
  • Методы кластеризации
  • Методы предсказания. Регрессия
  • Методы классификации
Элементы контроля

Элементы контроля

  • неблокирующий Аудиторная работа
  • неблокирующий Контрольная работа
  • неблокирующий экзамен
Промежуточная аттестация

Промежуточная аттестация

  • 2023/2024 учебный год 3 модуль
    0.2 * Аудиторная работа + 0.4 * экзамен + 0.4 * Контрольная работа
Список литературы

Список литературы

Рекомендуемая основная литература

  • Aggarwal C. Data Mining: The Textbook. Springer International Publishing, 2015. DOI: 10.1007/978-3-319-14142-8

Рекомендуемая дополнительная литература

  • Hastie, T., Tibshirani, R., Friedman, J. The elements of statistical learning: Data Mining, Inference, and Prediction. – Springer, 2009. – 745 pp.
  • Mirkin, B. Core concepts in data analysis: summarization, correlation and visualization. – Springer Science & Business Media, 2011. – 388 pp.