en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Dialogue

Дата публикации

15.02.2022

Авторы

Татьяна Шаврина Алена Феногенова Александр Кукушкин Владислав Михайлов Денис Шевелев Екатерина Артемова Мария Тихонова Антон Емельянов Валентин Малых

Поделиться

Russian SuperGLUE 1.1: Revising the Lessons not Learned by Russian NLP-models

Model evaluation, Natural language understanding, Benchmarks, NLP models, Language modelling, General Language understanding evaluation

Аннотация

In the last year, new neural architectures and multilingual pre-trained models have been released for Russian, which led to performance evaluation problems across a range of language understanding tasks.

This paper presents Russian SuperGLUE 1.1, an updated benchmark styled after GLUE for Russian NLP models. The new version includes a number of technical, user experience and methodological improvements, including fixes of the benchmark vulnerabilities unresolved in the previous version: novel and improved tests for understanding the meaning of a word in context (RUSSE) along with reading comprehension and common sense reasoning (DaNetQA, RuCoS, MuSeRC). Together with the release of the updated datasets, we improve the benchmark toolkit based on jiant framework for consistent training and evaluation of NLP-models of various architectures which now supports the most recent models for Russian. Finally, we provide the integration of Russian SuperGLUE with a framework for industrial evaluation of the open-source models, MOROCCO (MOdel ResOurCe COmparison), in which the models are evaluated according to the weighted average metric over all tasks, the inference speed, and the occupied amount of RAM.

Russian SuperGLUE is publicly available at https://russiansuperglue.com/

Читать в источнике Cкачать pdf

Похожие публикации

EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas

Михаил Мозиков, Никита Северин, Valeria Bodishtianu, Мария Глушанина, Иван Насонов, Даниил Орехов, Владислав Пехотин, Иван Маковецкий, Михаил Баклашкин, Василий Лаврентьев, Аким Цвигун, Денис Турдаков, Татьяна Шаврина, Андрей Савченко, Илья Макаров

Читать источник

COLING GenAIDetect

English and Multilingual Machine-Generated Text Detection: AI vs. Human

Yuxia Wang, Артем Шелманов, Джонибек Мансуров , Аким Цвигун, Владислав Михайлов, Rui Xing, Zhuohan Xie, Jiahui Geng, Giovanni Puccetti, Екатерина Артемова, Jinyan Su, Minh Ngoc Ta, Mervat Abassy, Kareem Ashraf Elozeiri, Saad El Dine Ahmed El Etter, Майя Голобурда, Tarek Mahmoud, Raj Vardhan Tomar, Nurkhan Laiyk, Osama Mohammed Afzal, Ryuto Koike, Masahiro Kaneko, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

ACL / Teaching NLP

Industry vs Academia: Running a Course on Transformers in Two Setups

Ирина Никишина, Мария Тихонова, Виктория Чекалина, Алексей Зайцев, Артем Важенцев, Александр Панченко

Читать источник

MERA: A Comprehensive LLM Evaluation in Russian

Алена Феногенова, Артём Червяков, Никита Мартынов, Анастасия Козлова, Мария Тихонова, Альбина Ахметгареева, Антон Емельянов, Денис Шевелев, Павел Лебедев, Леонид Синев, Катерина Коломейцева, Даниил Московский, Елизавета Гончарова, Никита Савушкин, Полина Михайлова, Анастасия Минаева, Денис Димитров, Александр Панченко, Сергей Марков

Читать источник

Super donors and super recipients: Studying cross-lingual transfer between high-resource and low-resource languages

Виталий Протасов, Елисей Стаковский, Екатерина Волошина, Татьяна Шаврина, Александр Панченко

Читать источник

mGPT: Few-Shot Learners Go Multilingual

Oleh Shliazhko, Алена Феногенова, Мария Тихонова, Anastasia Kozlova, Владислав Михайлов, Татьяна Шаврина

Читать источник

Language Resources and Evaluation

NEREL: a Russian information extraction dataset with rich annotation for nested entities, relations, and wikidata entity links

Natalia Loukachevitch, Екатерина Артемова, Tatiana Batura, Pavel Braslavski, Владимир Иванов, Suresh Manandhar, Alexander Pugachev, Igor Rozhkov, Артем Шелманов, Елена Тутубалина, Alexey Yandutov

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ