We use cookies in order to improve the quality and usability of the HSE website. More information about the use of cookies is available here, and the regulations on processing personal data can be found here. By continuing to use the site, you hereby confirm that you have been informed of the use of cookies by the HSE website and agree with our rules for processing personal data. You may disable cookies in your browser settings.

  • A
  • A
  • A
  • ABC
  • ABC
  • ABC
  • А
  • А
  • А
  • А
  • А
Regular version of the site

Research Seminar "Methods of Data Mining"

2021/2022
Academic Year
RUS
Instruction in Russian
4
ECTS credits
Delivered at:
Department of Applied Mathematics and Informatics (Faculty of Informatics, Mathematics, and Computer Science (HSE Nizhny Novgorod))
Course type:
Compulsory course
When:
2 year, 1, 2 module

Instructor


Krylov, Vladimir

Программа дисциплины

Аннотация

Научно-исследовательский семинар представляет собой комплекс аудиторных и самостоятельных занятий, на которых участники знакомятся с последними достижениями науки о данных (Data Science) и изучают как разработать программные реализации по избранным темам. Главной темой семинаров 2019-2020 года является "Топологический анализ данных" (Topological Data Analysis-TDA).
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов с современными программными библиотеками, предназначенными для анализа мультимедийных данных
  • Целью семинара является вовлечение студентов в реальный процесс изучения новых результатов в науке о данных и процесса имплементации новых технологий в реальную практическую деятельность
  • Получение необходимых знаний и навыков для выполнения научно-исследовательских проектов на примере создания интеллектуальных систем анализа данных
  • Приобретение умений поиска и анализа современных научных публикаций по методам интеллектуального анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет методы обработки изображений лиц (детектирование, верификация, идентификация), видео людей.
  • Применяет методы переноса знаний (transfer learning), локальные дескрипторы и структурные методы для решения задач распознавания изображений.
  • Применяет на практике современные методы обработки изображений (детектирование объектов, сегментация и синтез изображений).
  • Сравнивает и применяет нейросетевые модели распознавания речи. Интерпретирует методы распознавания и верификации диктора по звучащей речи.
  • Знать основные инструментальные средства топологического анализа данных. Научиться выполнять топологический анализ на простых примерах.
  • Ознакомление с конвейером топологического анализа и понимание основных топологических характеристик облака точек.
  • Ознакомление с перспективами использования топологических моделей данных для традиционных задач нейронных сетей - классификации и поиска аномалий
  • Ознакомление с существом и особенностями топологического анализа данных и его примененений. понимание отличий топологических представлений данных от метрических моделей
  • Получить практические навыки (умение) выполнять проект анализа 2D и 3D изображений с применением топологического анализа данных
  • Получить практические навыки (умение) выполнять проект анализа текстов на естественном языке с применением топологического анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Знакомство с терминологией и приложениями топологического анализа данных.
  • Методы переноса знаний (transfer learning) для распознавания изображений. Локальные дескрипторы ключевых точек изображений. Структурные методы распознавания образов на основе теории графов.
  • Программные билиотеки топологического анализа данных.
  • Детектирование объектов на изображениях и видео. Семантическая сегментация изображений. Синтез изображений. Обработка изображений лиц (детектирование, верификация, идентификация, распознавание эмоций, пола, возраста ).
  • Топологический анализ текстовых данных
  • Обработка изображений/видео людей (включая реидентификацию и распознавание действий). Методы повышения эффективности и оптимизации методов принятия решений и нейронных сетей. Прикладные задачи в области понимания изображений (image captioning, question answering, driver assistance, game playing).
  • Топологический анализ изображений
  • Обработка речевых сигналов (в том числе очистка от шума). Нейросетевые модели распознавания речи. Синтез речи. Методы распознавания и верификации диктора по звучащей речи.
  • Обучаемые модели классификации топологических структур.
  • Технологии топологического анализа.
Элементы контроля

Элементы контроля

  • неблокирующий лабораторные работы
  • неблокирующий устный экзамен
    Экзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий лабораторные работы
  • неблокирующий устный экзамен
    Экзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий Экзамен
  • неблокирующий доклад
  • неблокирующий Экзамен
  • неблокирующий доклад
Промежуточная аттестация

Промежуточная аттестация

  • 2020/2021 учебный год 4 модуль
    0.5 * устный экзамен + 0.5 * лабораторные работы
  • 2021/2022 учебный год 2 модуль
    0.3 * доклад + 0.7 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Witten, I. H. et al. Data Mining: Practical machine learning tools and techniques. – Morgan Kaufmann, 2017. – 654 pp.
  • Антонио, Д. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / Д. Антонио, П. Суджит ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2018. — 294 с. — ISBN 978-5-97060-573-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/111438 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Вычислительная топология, учебник, 213 с., Яковлев, Е. И., 2005
  • Ростовцев В.С. - Искусственные нейронные сети: учебник - Издательство "Лань" - 2019 - 216с. - ISBN: 978-5-8114-3768-9 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/122180
  • Селянкин В.В. - Компьютерное зрение. Анализ и обработка изображений: учебное пособие - Издательство "Лань" - 2019 - 152с. - ISBN: 978-5-8114-3368-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113938
  • Топология для младшекурсников, [учебник], 159 с., Васильев, В. А., 2014

Рекомендуемая дополнительная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
  • Webb, A. R. Statistical pattern recognition. – John Wiley & Sons, 20011. – 668 pp.
  • Аллен, Б. Д. Think DSP. Цифровая обработка сигналов на Python / Б. Д. Аллен ; перевод с английского А. Э. Бряндинский. — Москва : ДМК Пресс, 2017. — 160 с. — ISBN 978-5-97060-454-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93566 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Броневич, А. Г. Анализ неопределенности выделения информативных признаков и представлений изображений : монография / А. Г. Броневич, А. Н. Каркищенко, А. Е. Лепский. — Москва : ФИЗМАТЛИТ, 2013. — 320 с. — ISBN 978-5-9221-1499-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/59666 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Волков В.Ю. - Адаптивные и инвариантные алгоритмы обнаружения объектов на изображениях и их моделирование в Matlab - Издательство "Лань" - 2014 - 192с. - ISBN: 978-5-8114-1656-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/68475
  • Столов Е.Л. - Цифровая обработка сигналов. Водяные знаки в аудиофайлах: учебное пособие - Издательство "Лань" - 2018 - 176с. - ISBN: 978-5-8114-3014-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106736

Авторы

  • Крылов Владимир Владимирович
  • Калягин Валерий Александрович
  • Савченко Андрей Владимирович