• A
  • A
  • A
  • АБВ
  • АБВ
  • АБВ
  • А
  • А
  • А
  • А
  • А
Обычная версия сайта
18
Июль

NEWS Language ITems

Новая регулярная рубрика от от ЖурФипл с интересными фактами в мире лингвистики и IT-технологий.

1. Языковую модель на нейросетях от «Сбера» признали лучшей по пониманию текстов на русском языке. Она уступает только человеку.
Языковую модель ruRoberta-large finetune, разработанную в SberDevices, признали лучшей по пониманию текста на русском языке в рамках главного прейтинга по оценке текстовых моделей Russian SuperGLUE.

Лидерборд Russian SuperGLUE (General Language Understanding Evaluation) — первый рейтинг нейросетей для русского языка. Место в рейтинге определяется тем, насколько успешно нейросеть выполняет задания на логику, целеполагание и понимание смысла текста. Это открытый проект, помогающий оценивать и обучать русскоязычные нейросети. Фипловцам, работающим с нейросетями, проект тоже может пригодиться познакомиться с ним можно тут.

2.
Пандемия помогла: VAX слово года.

Пандемия сильно не только изменила наш образ жизни, но и повлияла на наш лексикон. Оксфордский словарь английского языка выбрал слово "vax" (краткая форма слова "вакцина") и производные от него главным словом 2021 года. Об этом 1 ноября сообщает The Guardian.

3. Языковые модели в онлайн-журнале ТЕХНО.

ТЕХНО онлайн-журнал, новый проект Яндекса. Каждый выпуск рассказывает про одну современную технологию: как она появилась, где её используют и как мы с вами можем с ней взаимодействовать. Первый октябрьский выпуск о языковых моделях.

Спросите её о чём хотите - языковая модель отвечает на вопросы и может с нами поболтать: большие языковые модели хорошо запоминают правила языка и следят за ходом беседы, запоминая, что собеседник говорил им пару сообщений назад. Модель YaLM дополнительно обучали на десятках тысяч публичных сообщений из соцсетей, поэтому она хорошо владеет разговорной речью и ведет беседу максимально ествественно. С такой же моделью можно поболтать и в Алисе. Чтобы сделать разговор еще интереснее, разработчики научили модель генерировать тексты в стиле Хабра — поэтому она с удовольствием поддержит разговор с компьютерным лингвистом о про нейросетях и новых технологиях. Мы так и сделали и поговорили с моделью о компьютерной лингвистике:

Скриншот сайта https://techno.yandex.ru/

Автор:
Мария Стягова, 20ФиПЛ.