Мы используем файлы cookies для улучшения работы сайта НИУ ВШЭ и большего удобства его использования. Более подробную информацию об использовании файлов cookies можно найти здесь, наши правила обработки персональных данных – здесь. Продолжая пользоваться сайтом, вы подтверждаете, что были проинформированы об использовании файлов cookies сайтом НИУ ВШЭ и согласны с нашими правилами обработки персональных данных. Вы можете отключить файлы cookies в настройках Вашего браузера.

  • A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта

11 декабря на онлайн-семинаре НУГ выступил Иван Гречихин

Тема доклада: "Фреймворк MuZero: история развития, технические возможности"


В последние годы появлялись заметные новости о том, как сложная система обучения с подкреплением начала побеждать лучших чемпионов-людей в одну из самых сложных с точки зрения комбинаторики игру Go. Такой результат был достигнут несколькими прорывными идеями, которые позволили расширить возможности алгоритмов обучения с подкреплением. Их развитие привело к созданию обобщённого фреймворка MuZero, способного играть в любую игру заданную пользователем. В докладе сотрудника НУГ Ивана Гречихина был рассмотрен путь к появлению этого фреймворка, а также его возможности для решения практических задач.
Слайды выступления доступны на странице семинаров НУГ.