• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

Искусственный интеллект сегодня: взгляд эксперта и опыт студентов

Почти серьезная статья об искусственном интеллекте: интервью эксперта в области ИИ Виталия Витальевича Позднякова и студентов ФиПЛа, проходивших практику в институте искусственного интеллекта.

Искусственный интеллект сегодня: взгляд эксперта и опыт студентов

Изображение создано с помощью нейросети Leonardo AI

Оперативная сводка!

В течение продолжительного времени до нас доходили, как указывается, правдивые известия относительно распространения необыкновенного аппарата под названием “искусственный интеллект”. Отмечается также, что в современном мире уже невозможно игнорировать изменения, к которым привело его появление. Но что можно сказать про науку, про проекты, которыми люди занимаются ежедневно и которые обязательно коснутся нас?

Чтобы лучше в этом разобраться, мы, дежурные корреспонденты ФиПЛ, не теряя времени, направили телеграмму с запросом контактов специалистов в этой области. Так, первым письмом мы обратились с волнующими вопросами к Виталию Витальевичу Позднякову, преподавателю НИУ ВШЭ, и совсем недавно сотруднику-исследователю в институте AIRI (Artificial Intelligence Research Institute) и к нашим друзьям-студентам, принявшим участие в исследованиях во время прохождения практики. Мы постарались выяснить все, что может быть интересно нашим читателям: какие проекты актуальны в исследованиях искусственного интеллекта, в каких сферах он сейчас уже задействован и какие навыки оказываются самыми полезными в подобной работе.

Разумеется, спешим поделиться с вами!

XX месяц XXXX

Уважаемый Виталий Витальевич,

Позвольте выразить благодарность за Ваш отклик и готовность ответить на наши вопросы. Нас очень волнуют Ваши мысли насчёт…

С уважением,

ЖурFeople

Интервью с Виталием Витальевичем Поздняковым

  • Расскажите о вашей работе в AIRI: какие проекты сейчас наиболее актуальны?

AIRI занимается исследованиями и внедрением систем на базе искусственного интеллекта. У нас много разных команд, и они обычно собраны по тематике, например медицинские данные, обработка естественного языка, обучение с подкреплением, компьютерное зрение и так далее Я работаю в команде Industrial AI - промышленный искусственный интеллект, то есть мы занимаемся разработкой и исследованиями систем, которые решают те или иные задачи, связанные непосредственно с промышленностью. Один из таких проектов – поиск аномалий и детекция неисправности в химических процессах. Предположим, у нас есть химический процесс, который описывается показаниями сенсоров: температура, скорость потока, давление и так далее. Основываясь на этих данных, необходимо диагностировать, в каком состоянии находится процесс, присутствуют ли неисправности. Мы исследуем, как можно использовать разные архитектуры нейронных сетей, методы машинного обучения, чтобы решать такие задачи более эффективно, понять, как влияет разметка данных на качество моделей.

 

Фиксируем: большое количество данных отдается этому искусственному интеллекту, привлекаются архитекторы, видимо, автомеханики, и все это оказывается эффективным. Однако почему же исследователь решил с этим работать, как узнал об этом?

  •  Как вы пришли в сферу ИИ? Был ли момент, когда Вы поняли, что хотите заниматься именно этим?

По первому образованию я инженер в сфере информационных технологий. Я долгое время работал программистом, но тема искусственного интеллекта меня так или иначе интересовала, это было где-то в середине десятых годов. Тогда и начали появляться какие-то новости, заметки по поводу ИИ, и я подумал, что хотел бы больше погрузиться в эту сферу. Я начал изучать – сначала самостоятельно, а потом уже поступил в магистратуру Высшей школы экономики, где пришел к теме машинного обучения и в целом искусственного интеллекта, а после устроился на работу в институт.

 

Обучение – процесс небыстрый, в поисках себя учиться приходится постоянно. А если еще и машины обучать, и интеллекты строить… Что же для этого нужно?

  • Какие навыки (hard/soft skills) оказались самыми полезными в вашей работе?

Если говорить про науку, то здесь очень ценится умение формулировать гипотезы, составлять research proposal – документ, который описывает, в чем цель вашего исследования, что вы хотите проверить, какой результат вы хотите получить, умение правильно составить дизайн эксперимента, который позволит корректно ответить на ваш вопрос, чтобы подтвердить или опровергнуть гипотезу. Эти вещи важны, но обычно это приходит через опыт работы в какой-то научной сфере, либо во время обучения в университете, при подготовке ВКР. Некоторые студенты еще в университете начинают писать статьи, и, в принципе, это тоже научный пайплайн. 

Можно сказать, что умение работать по научному пайплайну является одним из ключевых навыков.

Что касается softskills, то это очень зависит от проекта. Есть работы индивидуальные, в которых задействованы один-два человека. Соответственно, нужно просто найти общий язык со своим сокомандником. Если же работа коллективная, то навыки определяются ролью в проекте.

С точки зрения руководителя важно уметь сформулировать план, следовать ему, установить понятные точки контроля, метрики для выполнения плана (общие вещи, касающиеся на самом деле любой деятельности). С точки зрения исследователя должно присутствовать понимание процесса: в какой точке вы находитесь, что делать дальше. 

Особенность же данной специальности – необходимость проявлять фантазию. Именно исследовательский навык позволяет в определенный момент понять, что можно попробовать сделать нечто помимо намеченных задач. В ходе эксперимента или чтения источников появляются идеи, и вот здесь важно их правильно воспринять и потом адаптировать под свою работу.

 

Хорошо, что наши студенты точно к такому готовы!

  • Какой совет Вы бы дали студентам, которые хотят связать карьеру с ИИ?

Если говорить конкретно про образование, которое так или иначе сфокусировано на искусственном интеллекте, то здесь, конечно, важно осознать, куда вы пойдете после обучения: в науку или в индустрию. В зависимости от этого стоит ориентироваться на выбор и научного руководителя, и на тему работы, и конкретные навыки, которые стоит прокачивать. Если вам ближе научные исследования, то лучше всего выбирать руководителя, который работает в лаборатории, у которого есть план/тематика научных проектов. Ознакомьтесь с публикациями научного руководителя – насколько вам вообще это интересно? Если все нравится, можно смело пробовать.

 

Как будто все довольно просто и понятно, однако, что же нужно делать?

  • Какие у студентов есть возможности для стажировок/практики в AIRI или других организациях, с которыми вы сотрудничаете?

Каких-то единых правил набора нет, у всех людей разные требования к практикантам: где-то достаточно прислать резюме, где-то также могут попросить сделать тестовое задание, где-то пройти собеседование. 

Что касается стажировок, тут уже сложнее. Бывает, что открывают просто набор. В IT-компаниях часто есть открытые стажировки на конкретные даты. То есть, если взять Яндекс, или Сбербанк, или Т-банк, у них есть отдельный набор, проходящий в несколько этапов по определенной схеме. Здесь нет какой-то сезонности, нужно следить за новостями и общаться с руководителями команд, спрашивать на конференциях либо писать на почту.

 

  •  С чего можно начать свой путь в сфере ИИ на данный момент?

Если вы идете в науку, большой плюс, когда у вас уже есть публикация. Причем не обязательно, чтобы эти публикации были в топовых журналах. Публикация даже на региональной конференции или в журнале ВУЗа, в котором вы учитесь, тоже будет достоинством. 

Еще хорошо указывать гитхаб, однако его тоже нужно хорошо оформить: сделайте пару репозиториев, которые будут в топе на страничке, где будут README файлы, описание. Если это эксперименты, то должно быть написано, как эти эксперименты воспроизводить, какие вы результаты получили, чтобы было понятно, как это оценивать. 

Также ценится участие в соревнованиях, в хакатонах – это, несомненно, круто, даже если само мероприятие не очень масштабное.

Все как полагается: структура и активная социальная и учебная позиция! К такому нам не привыкать. Однако как все-таки стоит относиться к этому ИИ?

  •  Как вы считаете, от ИИ больше пользы или вреда?

Это серьезный вопрос с неопределенным ответом. Сфера очень быстро развивается, соответственно, очень быстро может поменяться. Пока ярко выраженного вреда, наверное, нет.

Есть опасения, связанные с нейронными сетями, которые генерируют изображения, что в некоторых задачах они могут заменить людей: иллюстраторов, дизайнеров и других специалистов. И это потенциальная опасность с точки зрения рынка труда, потери работы. Но я не читал конкретных исследований по этой теме, которые бы подтверждали или опровергали этот тезис. Кажется, здесь нужен какой-то контроль со стороны государства и общества для того, чтобы минимизировать риски.

Риски, конечно, всегда есть, потому что приходится искать баланс между эффективностью и понятностью. И вот как раз все, что связано с искусственным интеллектом, на данном этапе имеет перекос в сторону эффективности. Когда вы решаете какую-то задачу с помощью классических методов, основанных на статистике, на классическом машинном обучении, результаты, как правило, более понятные. Когда же вы переходите к нейронным сетям, то они более эффективные, но что конкретно приводит к тому или иному действию нейронной сети, довольно сложно понять. И это тоже отдельная тема исследований. Плюс есть угрозы, связанные с атаками нейронной сети.

Мы этим вопросом тоже занимались. Например, есть классический пример состязательной атаки — в данные подмешивается едва заметный шум, который полностью меняет ответ системы искусственного интеллекта. Допустим, у вас есть картинка панды, и в эту картинку панды вносятся незаметные человеку дополнения. Нейронная сеть начинает неправильно классифицировать изображение и говорит, что это не панда, а гиббон. Это показало, что некоторые искажения входных данных могут кардинально поменять предсказания и действия системы на базе искусственного интеллекта. Если мы говорим про классификацию изображений, которые пользователи используют для чего-то у себя на телефоне, наверное, это не так опасно. А если мы говорим про приложение, допустим, в медицине, где нужно найти раковую опухоль на снимке, или приложение в химической промышленности, где авария может привести к серьезным последствиям, то там, конечно, риск многократно увеличивается. 

Поэтому рисков очень много, а что в итоге — польза или вред — непонятно.

Студенты ФиПЛа о практике в AIRI

Такое количество сфер для исследования, нам кажется, не оставят равнодушным никого. На данный момент это уже наша реальность, с которой многим хочется научиться взаимодействовать, понимать ее и помогать другим извлекать из этого пользу. Так, разумеется, и студенты ФиПЛа не смогли пройти мимо. Практику в AIRI прошли студенты 3 курса: Маргарита Вельмисова, Ульяна Нагорная, Вячеслав Угольников. Вот что нам удалось разузнать о том, как проходила практика в институте AIRI под руководством Виталия Витальевича.

- Над каким проектом ты работал(а) во время практики? 

Рита: Я работала с задачей Relation Extraction. Использовала два метода: классический ML и нейросеть для решения. По результатам строили и анализировали графы получившихся триплетов.

Ульяна: Я решала задачу поиска именованных сущностей в текстах (NER) для построения графов знаний (KG). Меня настолько заинтересовала эта тема, что после практики я расширила свой проект и создала end-to-end систему для построения биомедицинских графов знаний.

Слава: Я должен был сравнить два метода NER, необходимых для дальнейшего построения графов знаний: с помощью машинного обучения и с помощью промптинга, и затем сравнить точность работы методов. 

 

- Какой самый полезный навык или знание ты получил(а) на практике? Что запомнилось больше всего?

Рита: Больше всего понравилось и запомнилось то, как Виталий Витальевич помогал досконально разбираться с возникшими ошибками и недочетами. Все решения разбирали вместе и чинили, казалось бы, даже самые провальные. Эта практика научила меня не бросать начатое и не делать поспешных выводов о (не)возможности конкретной реализации.

Ульяна: Думаю, что аналитическое и критическое мышление стали ключевыми навыками, которые мне удалось прокачать на практике в AIRI. Изначально казалось, что для реализации итогового проекта мне недостаточно знаний, компетенций, конкретных хард-навыков, но в результате именно благодаря  правильному настрою и профессиональной поддержке со стороны Виталия Витальевича Позднякова получилось достичь желаемого. Я и мои коллеги самостоятельно ставили перед собой цели, искали пути решения, обсуждали возникшие проблемы, поэтому у нас создалось целостное представление о том, чем мы занимаемся. На самом деле, это очень важный этап в процессе обучения  — формирование собственного отношения к существующей проблеме, которое подкреплено как теоретическими (мы изучили много научных статей по теме), так и практическими основаниями (не все получалось с первого раза, приходилось много пробовать). 

Слава: Всё, что я делал на практике, можно назвать словом “опыт” в целом. По ходу работы нужно было разобраться с такими вещами, как: обзорное знакомство со специальной научной литературой, построение дизайна собственного исследования, подключение к языковой модели через API, написание хороших промптов, настройка пайплайнов spaCy, построение графов знаний, написание отчёта в LaTeX и NER (распознавание именованных сущностей — одна из задач NLP, обработки естественного языка). Последнее мне кажется особенно важным, так как это позволило заглянуть в мир NLP. Эта практика была чем-то новым, сложным, интересным и позволяющим понять, как может выглядеть моя деятельность в будущем. 

 

- Кому стоит выбирать подобный вид практики?

Рита:  На данную практику не стоит идти, если совсем нет понимания хотя бы основ ML и нейросетей. Темп практики был достаточно высокий, много самостоятельной работы. На практику стоит идти, если ко всему этому готов.

Ульяна: Думаю, такой вид практики подходит для тех, кто интересуется научной деятельностью и кого не пугает череда неудачных попыток. Уверяю, преодолев этот страх, можно добиться больших результатов, и это того стоит.

Слава: Уверен, такой вид практики прекрасно подойдёт студентам, которые метят в NLP или в другую область IT (ML, Data Science и др.), так как позволяет оттачивать навыки написания кода и расширяет знания в соответствующей области, в том числе благодаря чтению научной литературы.

 

 

Корреспонденция предупреждает: всю достоверную информацию ищите исключительно в ответах эксперта.

Статья создана в образовательных (и развлекательных) целях.

 

Авторы:

Софья Нуртдинова, Арина Савина, 22ФиПЛ