en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Natural language engineering

Дата публикации

09.06.2022

Авторы

Мария Тихонова Владислав Михайлов Дина Писаревская Валентин Малых Татьяна Шаврина

Поделиться

Ad astra or astray: Exploring linguistic knowledge of multilingual BERT through NLI task

Evaluation, Model interpretation, Multilinguality, Natural language inference, Cross-lingual learning, Transfer learning

Аннотация

Recent research has reported that standard fine-tuning approaches can be unstable due to being prone to various sources of randomness, including but not limited to weight initialization, training data order, and hardware. Such brittleness can lead to different evaluation results, prediction confidences, and generalization inconsistency of the same models independently fine-tuned under the same experimental setup. Our paper explores this problem in natural language inference, a common task in benchmarking practices, and extends the ongoing research to the multilingual setting. We propose six novel textual entailment and broad-coverage diagnostic datasets for French, German, and Swedish. Our key findings are that the mBERT model demonstrates fine-tuning instability for categories that involve lexical semantics, logic, and predicate-argument structure and struggles to learn monotonicity, negation, numeracy, and symmetry. We also observe that using extra training data only in English can enhance the generalization performance and fine-tuning stability, which we attribute to the cross-lingual transfer capabilities. However, the ratio of particular features in the additional training data might rather hurt the performance for model instances. We are publicly releasing the datasets, hoping to foster the diagnostic investigation of language models (LMs) in a cross-lingual scenario, particularly in terms of benchmarking, which might promote a more holistic understanding of multilingualism in LMs and cross-lingual knowledge transfer.

Читать в источнике

Похожие публикации

COLING / Workshop

Genai content detection task 1: English and multilingual machine-generated text detection: Ai vs. human

Yuxia Wang, Артем Шелманов, Джонибек Мансуров , Аким Цвигун, Владислав Михайлов, Rui Xing, Zhuohan Xie, Jiahui Geng, Giovanni Puccetti, Екатерина Артемова, Minh Ngoc Ta, Mervat Abassy, Kareem Ashraf Elozeiri, Saad El Dine Ahmed El Etter, Майя Голобурда, Tarek Mahmoud, Raj Vardhan Tomar, Nurkhan Laiyk, Osama Mohammed Afzal, Ryuto Koike, Masahiro Kaneko, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

COLING GenAIDetect

English and Multilingual Machine-Generated Text Detection: AI vs. Human

Yuxia Wang, Артем Шелманов, Джонибек Мансуров , Аким Цвигун, Владислав Михайлов, Rui Xing, Zhuohan Xie, Jiahui Geng, Giovanni Puccetti, Екатерина Артемова, Jinyan Su, Minh Ngoc Ta, Mervat Abassy, Kareem Ashraf Elozeiri, Saad El Dine Ahmed El Etter, Майя Голобурда, Tarek Mahmoud, Raj Vardhan Tomar, Nurkhan Laiyk, Osama Mohammed Afzal, Ryuto Koike, Masahiro Kaneko, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas

Михаил Мозиков, Никита Северин, Valeria Bodishtianu, Мария Глушанина, Иван Насонов, Даниил Орехов, Владислав Пехотин, Иван Маковецкий, Михаил Баклашкин, Василий Лаврентьев, Аким Цвигун, Денис Турдаков, Татьяна Шаврина, Андрей Савченко, Илья Макаров

Читать источник

ACL / Teaching NLP

Industry vs Academia: Running a Course on Transformers in Two Setups

Ирина Никишина, Мария Тихонова, Виктория Чекалина, Алексей Зайцев, Артем Важенцев, Александр Панченко

Читать источник

MERA: A Comprehensive LLM Evaluation in Russian

Алена Феногенова, Артём Червяков, Никита Мартынов, Анастасия Козлова, Мария Тихонова, Альбина Ахметгареева, Антон Емельянов, Денис Шевелев, Павел Лебедев, Леонид Синев, Катерина Коломейцева, Даниил Московский, Елизавета Гончарова, Никита Савушкин, Полина Михайлова, Анастасия Минаева, Денис Димитров, Александр Панченко, Сергей Марков

Читать источник

Super donors and super recipients: Studying cross-lingual transfer between high-resource and low-resource languages

Виталий Протасов, Елисей Стаковский, Екатерина Волошина, Татьяна Шаврина, Александр Панченко

Читать источник

mGPT: Few-Shot Learners Go Multilingual

Oleh Shliazhko, Алена Феногенова, Мария Тихонова, Anastasia Kozlova, Владислав Михайлов, Татьяна Шаврина

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ