• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Книга
Integral Robot Technologies and Speech Behavior

Kharlamov A. A., Pantiukhin D., Borisov V. et al.

Newcastle upon Tyne: Cambridge Scholars Publishing, 2024.

Статья
Clique detection with a given reliability

Semenov D., Koldanov A. P., Koldanov P. et al.

Annals of Mathematics and Artificial Intelligence. 2024.

Глава в книге
Neural Networks for Speech Synthesis of Voice Assistants and Singing Machines

Pantiukhin D.

In bk.: Integral Robot Technologies and Speech Behavior. Newcastle upon Tyne: Cambridge Scholars Publishing, 2024. Ch. 9. P. 281-296.

Препринт
DAREL: Data Reduction with Losses for Training Acceleration of Real and Hypercomplex Neural Networks

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

NeurIPS 2023 Workshop. ZmuLcqwzkl. OpenReview, 2023

Научно-исследовательский семинар "Методы интеллектуального анализа данных и компьютерной лингвистики"

2023/2024
Учебный год
RUS
Обучение ведется на русском языке
6
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Настоящий НИС относится к блоку программы Научно-исследовательская работа. Программа предназначена для приобретения студентами навыков разработки проектов создания интеллектуальных систем анализа мультимедийных данных Для успешного изучения дисциплины студент должен владеть достаточными знаниями и навыками по следующим дисциплинам: Современные методы анализа данных; Стохастические модели; Машинное обучение. Основные положения дисциплины могут быть использованы в дальнейшем при написании выпускной квалификационной работы.
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов с современными программными библиотеками, предназначенными для анализа мультимедийных данных
  • Получение необходимых знаний и навыков для выполнения научно-исследовательских проектов на примере создания интеллектуальных систем анализа данных
  • Приобретение умений поиска и анализа современных научных публикаций по методам интеллектуального анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет методы обработки изображений лиц (детектирование, верификация, идентификация), видео людей.
  • Применяет методы переноса знаний (transfer learning), локальные дескрипторы и структурные методы для решения задач распознавания изображений.
  • Применяет на практике современные методы обработки изображений (детектирование объектов, сегментация и синтез изображений).
  • Сравнивает и применяет нейросетевые модели распознавания речи. Интерпретирует методы распознавания и верификации диктора по звучащей речи.
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Методы переноса знаний (transfer learning) для распознавания изображений. Локальные дескрипторы ключевых точек изображений. Структурные методы распознавания образов на основе теории графов.
  • Детектирование объектов на изображениях и видео. Семантическая сегментация изображений. Синтез изображений. Обработка изображений лиц (детектирование, верификация, идентификация, распознавание эмоций, пола, возраста ).
  • Обработка изображений/видео людей (включая реидентификацию и распознавание действий). Методы повышения эффективности и оптимизации методов принятия решений и нейронных сетей. Прикладные задачи в области понимания изображений (image captioning, question answering, driver assistance, game playing).
  • Обработка речевых сигналов (в том числе очистка от шума). Нейросетевые модели распознавания речи. Синтез речи. Методы распознавания и верификации диктора по звучащей речи.
Элементы контроля

Элементы контроля

  • неблокирующий Лабораторная работа 1
  • неблокирующий Лабораторная работа 2
  • неблокирующий Экзамен
  • неблокирующий Экзамен
  • неблокирующий Лабораторная работа 1
  • неблокирующий Лабораторная работа 2
Промежуточная аттестация

Промежуточная аттестация

  • 2022/2023 учебный год 4 модуль
    0.2 * Лабораторная работа 1 + 0.6 * Экзамен + 0.2 * Лабораторная работа 2
  • 2023/2024 учебный год 2 модуль
    0.2 * Лабораторная работа 2 + 0.2 * Лабораторная работа 1 + 0.6 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Witten, I. H. et al. Data Mining: Practical machine learning tools and techniques. – Morgan Kaufmann, 2017. – 654 pp.
  • Антонио, Д. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / Д. Антонио, П. Суджит , перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2018. — 294 с. — ISBN 978-5-97060-573-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/111438 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Ростовцев В.С. - Искусственные нейронные сети: учебник - Издательство "Лань" - 2019 - 216с. - ISBN: 978-5-8114-3768-9 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/122180
  • Селянкин В.В. - Компьютерное зрение. Анализ и обработка изображений: учебное пособие - Издательство "Лань" - 2019 - 152с. - ISBN: 978-5-8114-3368-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113938

Рекомендуемая дополнительная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
  • Webb, A. R. Statistical pattern recognition. – John Wiley & Sons, 20011. – 668 pp.
  • Аллен, Б. Д. Think DSP. Цифровая обработка сигналов на Python / Б. Д. Аллен , перевод с английского А. Э. Бряндинский. — Москва : ДМК Пресс, 2017. — 160 с. — ISBN 978-5-97060-454-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93566 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Броневич, А. Г. Анализ неопределенности выделения информативных признаков и представлений изображений : монография / А. Г. Броневич, А. Н. Каркищенко, А. Е. Лепский. — Москва : ФИЗМАТЛИТ, 2013. — 320 с. — ISBN 978-5-9221-1499-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/59666 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Волков В.Ю. - Адаптивные и инвариантные алгоритмы обнаружения объектов на изображениях и их моделирование в Matlab - Издательство "Лань" - 2014 - 192с. - ISBN: 978-5-8114-1656-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/68475
  • Столов Е.Л. - Цифровая обработка сигналов. Водяные знаки в аудиофайлах: учебное пособие - Издательство "Лань" - 2018 - 176с. - ISBN: 978-5-8114-3014-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106736