en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

EMNLP

Дата публикации

21.10.2021

Авторы

Артем Шелманов Николай Арефьев Дмитрий Харчев

Поделиться

NB-MLM: Efficient Domain Adaptation of Masked Language Models for Sentiment Analysis

Аннотация

While Masked Language Models (MLM) are pre-trained on massive datasets, the additional training with the MLM objective on domain or task-specific data before fine-tuning for the final task is known to improve the final performance. This is usually referred to as the domain or task adaptation step. However, unlike the initial pre-training, this step is performed for each domain or task individually and is still rather slow, requiring several GPU days compared to several GPU hours required for the final task fine-tuning. We argue that the standard MLM objective leads to inefficiency when it is used for the adaptation step because it mostly learns to predict the most frequent words, which are not necessarily related to a final task. We propose a technique for more efficient adaptation that focuses on predicting words with large weights of the Naive Bayes classifier trained for the task at hand, which are likely more relevant than the most frequent words. The proposed method provides faster adaptation and better final performance for sentiment analysis compared to the standard approach.

Читать в источнике Cкачать pdf

Похожие публикации

Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph

Roman Vashurin, Екатерина Фадеева, Артем Важенцев, Аким Цвигун, Даниил Васильев, Rui Xing, Abdelrahman Boda Sadallah, Людмила Рванова, Сергей Петраков, Александр Панченко, Timothy Baldwin, Preslav Nakov, Максим Панов, Артем Шелманов

Читать источник

Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models

Глеб Кузьмин, Nemeesh Yadav, Иван Смирнов, Timothy Baldwin, Артем Шелманов

Читать источник

Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models

Артем Важенцев, Людмила Рванова, Иван Лазичный, Александр Панченко, Максим Панов, Timothy Baldwin, Артем Шелманов

Читать источник

NAACL / SemEval

Semeval-2024 task 8: Multigenerator, multidomain, and multilingual black-box machine-generated text detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Chenxi Whitehouse, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

Overview of PAN 2025: Generative AI Detection, Multilingual Text Detoxification, Multi-Author Writing Style Analysis, and Generative Plagiarism Detection

Janek Bevendorff, Дарина Дементьева, Maik Fröbe, Bela Gipp, André Greiner-Petter, Jussi Karlgren, Maximilian Mayerl, Preslav Nakov, Александр Панченко, Martin Potthast, Артем Шелманов, Efstathios Stamatatos, Benno Stein, Yuxia Wang, Matti Wiegmann, Eva Zangerle

Читать источник

COLING GenAIDetect

English and Multilingual Machine-Generated Text Detection: AI vs. Human

Yuxia Wang, Артем Шелманов, Джонибек Мансуров , Аким Цвигун, Владислав Михайлов, Rui Xing, Zhuohan Xie, Jiahui Geng, Giovanni Puccetti, Екатерина Артемова, Jinyan Su, Minh Ngoc Ta, Mervat Abassy, Kareem Ashraf Elozeiri, Saad El Dine Ahmed El Etter, Майя Голобурда, Tarek Mahmoud, Raj Vardhan Tomar, Nurkhan Laiyk, Osama Mohammed Afzal, Ryuto Koike, Masahiro Kaneko, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ