11 декабря на онлайн-семинаре НУГ выступил Иван Гречихин
Тема доклада: "Фреймворк MuZero: история развития, технические возможности"
В последние годы появлялись заметные новости о том, как сложная система обучения с подкреплением начала побеждать лучших чемпионов-людей в одну из самых сложных с точки зрения комбинаторики игру Go. Такой результат был достигнут несколькими прорывными идеями, которые позволили расширить возможности алгоритмов обучения с подкреплением. Их развитие привело к созданию обобщённого фреймворка MuZero, способного играть в любую игру заданную пользователем. В докладе сотрудника НУГ Ивана Гречихина был рассмотрен путь к появлению этого фреймворка, а также его возможности для решения практических задач.
Слайды выступления доступны на странице семинаров НУГ.