• A
  • A
  • A
  • АБB
  • АБB
  • АБB
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
Книга
Integral Robot Technologies and Speech Behavior

Kharlamov A. A., Pantiukhin D., Borisov V. et al.

Newcastle upon Tyne: Cambridge Scholars Publishing, 2024.

Глава в книге
Neural Networks for Speech Synthesis of Voice Assistants and Singing Machines

Pantiukhin D.

In bk.: Integral Robot Technologies and Speech Behavior. Newcastle upon Tyne: Cambridge Scholars Publishing, 2024. Ch. 9. P. 281-296.

Препринт
DAREL: Data Reduction with Losses for Training Acceleration of Real and Hypercomplex Neural Networks

Demidovskij A., Трутнев А. И., Тугарев А. М. et al.

NeurIPS 2023 Workshop. ZmuLcqwzkl. OpenReview, 2023

Научно-исследовательский семинар "Методы интеллектуального анализа данных"

2021/2022
Учебный год
RUS
Обучение ведется на русском языке
4
Кредиты

Преподаватель

Программа дисциплины

Аннотация

Научно-исследовательский семинар представляет собой комплекс аудиторных и самостоятельных занятий, на которых участники знакомятся с последними достижениями науки о данных (Data Science) и изучают как разработать программные реализации по избранным темам. Главной темой семинаров 2019-2020 года является "Топологический анализ данных" (Topological Data Analysis-TDA).
Цель освоения дисциплины

Цель освоения дисциплины

  • Знакомство студентов с современными программными библиотеками, предназначенными для анализа мультимедийных данных
  • Целью семинара является вовлечение студентов в реальный процесс изучения новых результатов в науке о данных и процесса имплементации новых технологий в реальную практическую деятельность
  • Получение необходимых знаний и навыков для выполнения научно-исследовательских проектов на примере создания интеллектуальных систем анализа данных
  • Приобретение умений поиска и анализа современных научных публикаций по методам интеллектуального анализа данных.
Планируемые результаты обучения

Планируемые результаты обучения

  • Применяет методы обработки изображений лиц (детектирование, верификация, идентификация), видео людей.
  • Применяет методы переноса знаний (transfer learning), локальные дескрипторы и структурные методы для решения задач распознавания изображений.
  • Применяет на практике современные методы обработки изображений (детектирование объектов, сегментация и синтез изображений).
  • Сравнивает и применяет нейросетевые модели распознавания речи. Интерпретирует методы распознавания и верификации диктора по звучащей речи.
  • Знать основные инструментальные средства топологического анализа данных. Научиться выполнять топологический анализ на простых примерах.
  • Ознакомление с конвейером топологического анализа и понимание основных топологических характеристик облака точек.
  • Ознакомление с перспективами использования топологических моделей данных для традиционных задач нейронных сетей - классификации и поиска аномалий
  • Ознакомление с существом и особенностями топологического анализа данных и его примененений. понимание отличий топологических представлений данных от метрических моделей
  • Получить практические навыки (умение) выполнять проект анализа 2D и 3D изображений с применением топологического анализа данных
  • Получить практические навыки (умение) выполнять проект анализа текстов на естественном языке с применением топологического анализа данных
Содержание учебной дисциплины

Содержание учебной дисциплины

  • Знакомство с терминологией и приложениями топологического анализа данных.
  • Методы переноса знаний (transfer learning) для распознавания изображений. Локальные дескрипторы ключевых точек изображений. Структурные методы распознавания образов на основе теории графов.
  • Программные билиотеки топологического анализа данных.
  • Детектирование объектов на изображениях и видео. Семантическая сегментация изображений. Синтез изображений. Обработка изображений лиц (детектирование, верификация, идентификация, распознавание эмоций, пола, возраста ).
  • Топологический анализ текстовых данных
  • Обработка изображений/видео людей (включая реидентификацию и распознавание действий). Методы повышения эффективности и оптимизации методов принятия решений и нейронных сетей. Прикладные задачи в области понимания изображений (image captioning, question answering, driver assistance, game playing).
  • Топологический анализ изображений
  • Обработка речевых сигналов (в том числе очистка от шума). Нейросетевые модели распознавания речи. Синтез речи. Методы распознавания и верификации диктора по звучащей речи.
  • Обучаемые модели классификации топологических структур.
  • Технологии топологического анализа.
Элементы контроля

Элементы контроля

  • неблокирующий лабораторные работы
  • неблокирующий устный экзамен
    Экзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий лабораторные работы
  • неблокирующий устный экзамен
    Экзамен проводится в устной форме (опрос по проекту "Экзаменационные задания"). Экзамен проводится на платформе Zoom ( https://zoom.us/j/4917538372). К экзамену необходимо подключиться согласно расписанию ответов, высланному преподавателем на корпоративные почты студентов накануне экзамена. Компьютер студента должен удовлетворять требованиям: наличие рабочей камеры и микрофона, поддержка Zoom. Для участия в экзамене студент обязан: поставить на аватар свою фотографию, явиться на экзамен согласно точному расписанию, при ответе включить камеру и микрофон. Во время экзамена студентам запрещено: выключать камеру, пользоваться конспектами и подсказками. Кратковременным нарушением связи во время экзамена считается нарушение связи до 5 минут. Долговременным нарушением связи во время экзамена считается нарушение 5 минут и более. При долговременном нарушении связи студент не может продолжить участие в экзамене. Процедура пересдачи аналогична процедуре сдачи.
  • неблокирующий Экзамен
  • неблокирующий доклад
  • неблокирующий Экзамен
  • неблокирующий доклад
Промежуточная аттестация

Промежуточная аттестация

  • 2020/2021 учебный год 4 модуль
    0.5 * устный экзамен + 0.5 * лабораторные работы
  • 2021/2022 учебный год 2 модуль
    0.3 * доклад + 0.7 * Экзамен
Список литературы

Список литературы

Рекомендуемая основная литература

  • Christopher M. Bishop. (n.d.). Australian National University Pattern Recognition and Machine Learning. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsbas&AN=edsbas.EBA0C705
  • Witten, I. H. et al. Data Mining: Practical machine learning tools and techniques. – Morgan Kaufmann, 2017. – 654 pp.
  • Антонио, Д. Библиотека Keras – инструмент глубокого обучения. Реализация нейронных сетей с помощью библиотек Theano и TensorFlow / Д. Антонио, П. Суджит ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2018. — 294 с. — ISBN 978-5-97060-573-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/111438 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Вычислительная топология, учебник, 213 с., Яковлев, Е. И., 2005
  • Ростовцев В.С. - Искусственные нейронные сети: учебник - Издательство "Лань" - 2019 - 216с. - ISBN: 978-5-8114-3768-9 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/122180
  • Селянкин В.В. - Компьютерное зрение. Анализ и обработка изображений: учебное пособие - Издательство "Лань" - 2019 - 152с. - ISBN: 978-5-8114-3368-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/113938
  • Топология для младшекурсников, [учебник], 159 с., Васильев, В. А., 2014

Рекомендуемая дополнительная литература

  • Mariani, J. (2009). Language and Speech Processing. London, UK: Wiley-ISTE. Retrieved from http://search.ebscohost.com/login.aspx?direct=true&site=eds-live&db=edsebk&AN=310778
  • Webb, A. R. Statistical pattern recognition. – John Wiley & Sons, 20011. – 668 pp.
  • Аллен, Б. Д. Think DSP. Цифровая обработка сигналов на Python / Б. Д. Аллен ; перевод с английского А. Э. Бряндинский. — Москва : ДМК Пресс, 2017. — 160 с. — ISBN 978-5-97060-454-0. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/93566 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Броневич, А. Г. Анализ неопределенности выделения информативных признаков и представлений изображений : монография / А. Г. Броневич, А. Н. Каркищенко, А. Е. Лепский. — Москва : ФИЗМАТЛИТ, 2013. — 320 с. — ISBN 978-5-9221-1499-8. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/59666 (дата обращения: 00.00.0000). — Режим доступа: для авториз. пользователей.
  • Волков В.Ю. - Адаптивные и инвариантные алгоритмы обнаружения объектов на изображениях и их моделирование в Matlab - Издательство "Лань" - 2014 - 192с. - ISBN: 978-5-8114-1656-1 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/68475
  • Столов Е.Л. - Цифровая обработка сигналов. Водяные знаки в аудиофайлах: учебное пособие - Издательство "Лань" - 2018 - 176с. - ISBN: 978-5-8114-3014-7 - Текст электронный // ЭБС ЛАНЬ - URL: https://e.lanbook.com/book/106736