en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ACL

Дата публикации

21.05.2022

Авторы

Артем Важенцев Глеб Кузьмин Артем Шелманов Аким Цвигун Евгений Цымбалов Кирилл Федянин Максим Панов Александр Панченко Глеб Гусев Михаил Бурцев Манвел Аветисян Леонид Жуков

Поделиться

Uncertainty Estimation of Transformer Predictions for Misclassification Detection

Uncertainty estimation, Transformers, Mahalanobis distance, Dropout, Determinantal point process

Аннотация

Uncertainty estimation (UE) of model predictions is a crucial step for a variety of tasks such as active learning, misclassification / adversarial attack / out-of-distribution detection, etc. Most of the works on modeling the uncertainty of deep neural networks evaluate these methods on image classification tasks. Little attention has been paid to UE in natural language processing. To fill this gap, we perform a vast empirical investigation of state-of-the-art UE methods for Transformer models on misclassification detection in named entity recognition and text classification tasks and propose two computationally efficient modifications, one of which improves the state of the art and outperforms computationally intensive methods.

Читать в источнике

Похожие публикации

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

Юрий Куратов, Айдар Булатов, Пётр Анохин, Иван Родькин, Дмитрий Сорокин, Артем Сорокин, Михаил Бурцев

Читать источник

EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas

Михаил Мозиков, Никита Северин, Valeria Bodishtianu, Мария Глушанина, Иван Насонов, Даниил Орехов, Владислав Пехотин, Иван Маковецкий, Михаил Баклашкин, Василий Лаврентьев, Аким Цвигун, Денис Турдаков, Татьяна Шаврина, Андрей Савченко, Илья Макаров

Читать источник

GENATATOR: de novo Gene Annotation With DNA Language Model

Алексей Шмелёв, Artem Shadskiy, Юрий Куратов, Михаил Бурцев, Ольга Кардымон, Вениамин Фишман

Читать источник

Searching for Phenotypic Needles in Genomic Haystacks: DNA Language Models for Sex Prediction

Алла Чепурова, Юрий Куратов, Полина Белокопытова, Михаил Бурцев, Вениамин Фишман

Читать источник

Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph

Roman Vashurin, Екатерина Фадеева, Артем Важенцев, Аким Цвигун, Даниил Васильев, Rui Xing, Abdelrahman Boda Sadallah, Людмила Рванова, Сергей Петраков, Александр Панченко, Timothy Baldwin, Preslav Nakov, Максим Панов, Артем Шелманов

Читать источник

SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection

Никита Сушко, Александр Панченко, Елена Тутубалина

Читать источник

Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models

Глеб Кузьмин, Nemeesh Yadav, Иван Смирнов, Timothy Baldwin, Артем Шелманов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ