Компьютерное зрение по зову сердца
Алексей Березкин – магистрант второго года обучения образовательной программы «Master of Computer Vision», созданной в партнерстве с ведущими компаниями в области решений по компьютерному зрению Intel, Harman, Huawei, Xperience.ai, RoundU, Itseez3D. В интервью службе портала Алексей отметил дисциплины, полезные для профессионального роста, и поделился впечатлениями о переходе на новую образовательную платформу.
Алексей Березкин закончил бакалавриат факультета «Программное обеспечение ЭВМ и информационные технологии» МГТУ им. Н.Э. Баумана и Федеральную политехническую школу Лозанны EPFL. В 2021 году поступил в НИУ ВШЭ — Нижний Новгород на новую магистерскую онлайн-программу «Master of Computer Vision».
Какими критериями Алексей руководствовался при выборе программы, что показалось сложным в первых трех модулях обучения и какую мечту помогает реализовать магистерское образование, Алексей рассказал службе портала.
Алексей, почему Вы сделали выбор именно в пользу программы Master of Сomputer Vision?
Я давно интересуюсь сферой Computer Vision, очень повезло сразу устроиться по специальности — работаю над проектами, напрямую связанными с компьютерным зрением: классификация летательных аппаратов и птиц на фотографиях в реальном времени. Совсем недавно у меня был еще один проект, косвенно подходящий под Computer Vision: я разрабатывал приложение, которое определяет по показателям датчиков в телефоне падение человека. Основная сложность была в том, что на разных телефонах стоят датчики разной чувствительности, поэтому обучение нейронной сети для классификации реальных падений стало весьма нетривиальной задачей.
Актуальность, кстати, тоже сыграла свою роль в выборе – направление компьютерного зрения сейчас активно развивается, у него огромный потенциал. А из всех доступных в России образовательных программ по нейронным сетям именно программа нижегородской Вышки при всей отточенной образовательной структуре мне показалась самой творческой.
Как прошел первый год в онлайн-магистратуре?
Все было хорошо и удобно — отзывчивые преподаватели и административный персонал. Если появлялись вопросы по срокам или аттестации, они быстро решались.
В целом программа мне нравится, она кажется вполне сбалансированной. Пару раз, правда, у меня возникали сомнения в практической применимости некоторых знаний, которые нам преподавались. К примеру, на мой субъективный взгляд, в курсе по компьютерной архитектуре был очень объемный теоретический блок, большой упор сделан на историю развития. Впрочем, возможно, в будущем я смогу применить эти знания, просто пока с подобным не сталкивался.
Какой курс из представленных на программе показался Вам наиболее сложным? Наиболее полезным?
Сложным был начальный курс по С++. Я не сразу понял, почему выбор пал именно на этот язык программирования, но со временем при всей громоздкой структуре начал видеть его достоинства.
Наиболее полезным стал для меня курс по анализу данных. По окончании мы получили легко интерпретируемые нейронной сетью готовые данные, которые можно сразу запускать в работу. Нейронная сеть - достаточно капризная вещь. Реальные данные должны быть специально закодированы для их обработки, для этого есть разные методы, например, one-hot encoding. Большинство этих методов были объяснены. Еще, пожалуй, начальный курс математики тоже показался очень полезным — это прекрасное начало для тех, кто не сталкивался ранее с матричными вычислениями. Удачно сформированы задания – выполняя их, понимаешь, как это все работает, в итоге получается высокая результативность.
Как прошел переход с одной платформы на другую?
На самом деле, любая, даже самая идеальная платформа, это всего лишь инструмент. И новая платформа Вышки Smart LMS оказалась достаточно удобным инструментом, плавность работы которого обеспечивается учебным коллективом. Все вопросы решаются оперативно, преподаватели всегда готовы ответить на любые вопросы. Возможно, есть смысл доработать организацию информации по разделам, но само существование такой платформы в России и достаточно быстрый переход на нее - это очень круто.
Еще, оказалось, очень классная вещь – форумы, они были и на Coursera, но удобство их я оценил только на Smart LMS. Изучать материалы курса у меня получается с некоторым запозданием, а тут, даже если ты немного задерживаешься, можно посмотреть весь материал и ответы на вопросы, которые возникали у других студентов. По сути такая небольшая экосистема.
У вас скоро онлайн-защита проектного курса перед профессиональным IT-сообществом. Какой проект Вы представите?
Мне повезло с темой проекта. Каждому из студентов была дана модель, которую нужно было представить рабочим проектом и сделать веб-приложение для демонстрации ее работы. Я буду представлять модель семейства YOLOV5 — это нейронная сеть для определения разных объектов на одной фотографии. А везение мое в том, что такая модель встречается в одном из моих рабочих проектов, поэтому для меня это вдвойне интересно.
Есть ли у Вас какая-то мечта, которую Вы могли бы осуществить после окончания магистратуры?
Мне очень нравится то, чем я занимаюсь, - я всегда хотел совместить программирование и свой математический бэкграунд. Поступление в магистратуру для меня не столько необходимость, сколько следование зову сердца, так как очень хочется просто развиваться в этом направлении.
Computer Vision
Компьютерное зрение – область искусственного интеллекта, включающая в себя задачи обработки и понимания изображений и видео. Его традиционные методы используются, к примеру, в программах редактирования фотографий. В рамках направления «Компьютерное зрение» были впервые применены глубокие сверточные нейронные сети, которые в 2012 году совершили прорыв в конкурсе распознавания изображений ImageNet, что привело к революции и последующему буму в области Computer Vision. С тех пор появился целый ряд технологий, значительно расширивших области использования алгоритмов компьютерного зрения – распознавание лиц, трехмерная реконструкция сцен (построение трехмерной модели объектов по набору их изображений разного ракурса), добавление стилей знаменитых картин к обычным фотографиям, разнообразные мобильные приложения с функциями нахождения объектов на изображениях и многое другое.
Напоминаем, что прием документов на магистерскую онлайн программу «Master of Computer Vision» продолжается. Вступительные испытания проводятся с 24.05.2022 по 17.08.2022. Выпускники программы освоят анализ данных и машинного обучения (включая глубинное обучение); современные методы обработки, анализа и синтеза изображений и видео. Также они примут участие в проектах крупных IT компаний и получат реальные кейсы в свое портфолио.