en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ACL

Дата публикации

10.07.2023

Авторы

Артем Важенцев Аким Цвигун Глеб Кузмин Zeerak Talat Александр Панченко Максим Панов Михаил Бурцев Артем Шелманов

Поделиться

Hybrid Uncertainty Estimation for Selective Text Classification in Ambiguous Tasks

Аннотация

Many text classification tasks are inherently ambiguous, which results in automatic systems having a high risk of making mistakes, in spite of using advanced machine learning models. For example, toxicity detection in user-generated content is a subjective task, and notions of toxicity can be annotated according to a variety of definitions, that can be in conflict with one another. Instead of relying solely on automatic solutions, moderation of the most difficult and ambiguous cases can be delegated to human workers. Potential mistakes in automated classification can be identified by using uncertainty estimation (UE) techniques. Although UE is a rapidly growing field within natural language processing, we find that state-of-the-art UE methods estimate only epistemic uncertainty and show poor performance, or under-perform trivial methods for ambiguous tasks such as toxicity detection. We argue that in order to create robust uncertainty estimation methods for ambiguous tasks it is necessary to account also for aleatoric uncertainty. In this paper, we propose a new uncertainty estimation method that combines epistemic and aleatoric UE methods. We show that by using our hybrid method, we can outperform state-of-the-art UE methods for toxicity detection and other ambiguous text classification tasks.

Читать в источнике

Похожие публикации

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

Юрий Куратов, Айдар Булатов, Пётр Анохин, Иван Родькин, Дмитрий Сорокин, Артем Сорокин, Михаил Бурцев

Читать источник

EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas

Михаил Мозиков, Никита Северин, Valeria Bodishtianu, Мария Глушанина, Иван Насонов, Даниил Орехов, Владислав Пехотин, Иван Маковецкий, Михаил Баклашкин, Василий Лаврентьев, Аким Цвигун, Денис Турдаков, Татьяна Шаврина, Андрей Савченко, Илья Макаров

Читать источник

SPY: Enhancing Privacy with Synthetic PII Detection Dataset

Максим Савкин, Тимур Ионов, Василий Коновалов

Читать источник

NAACL / SemEval

Semeval-2024 task 8: Multigenerator, multidomain, and multilingual black-box machine-generated text detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Chenxi Whitehouse, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

Semantically-Informed Regressive Encoder Score

Василий Висков, Георгий Кокуш, Даниил Ларионов, Steffen Eger, Александр Панченко

Читать источник

Overview of PAN 2025: Generative AI Detection, Multilingual Text Detoxification, Multi-Author Writing Style Analysis, and Generative Plagiarism Detection

Janek Bevendorff, Дарина Дементьева, Maik Fröbe, Bela Gipp, André Greiner-Petter, Jussi Karlgren, Maximilian Mayerl, Preslav Nakov, Александр Панченко, Martin Potthast, Артем Шелманов, Efstathios Stamatatos, Benno Stein, Yuxia Wang, Matti Wiegmann, Eva Zangerle

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ