en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

AAAI

Дата публикации

25.02.2025

Авторы

Олег Сомов Елена Тутубалина

Поделиться

Confidence Estimation for Error Detection in Text-to-SQL Systems

Confidence Estimation, Error Detection, Text-to-SQL, LLM, Calibration

Аннотация

Text-to-SQL enables users to interact with databases throughnatural language, simplifying the retrieval and synthesis ofinformation. Despite the success of large language models(LLMs) in converting natural language questions into SQLqueries, their broader adoption is limited by two main challenges:achieving robust generalization across diverse queriesand ensuring interpretative confidence in their predictions. Totackle these issues, our research investigates the integrationof selective classifiers into text-to-SQL systems. We analysethe trade-off between coverage and risk using entropy basedconfidence estimation with selective classifiers and assess itsimpact on the overall performance of text-to-SQL models.Additionally, we explore the models’ initial calibration andimprove it with calibration techniques for better model alignmentbetween confidence and accuracy. Our experimental resultsshow that encoder-decoder T5 is better calibrated thanin-context-learning GPT 4 and decoder-only Llama 3, thusthe designated external entropy-based selective classifier hasbetter performance. The study also reveal that, in terms oferror detection, selective classifier with a higher probabilitydetects errors associated with irrelevant questions rather thanincorrect query generations.

Читать в источнике Cкачать pdf

Похожие публикации

ShortPathQA: A Dataset for Controllable Fusion of Large Language Models with Knowledge Graphs

Михаил Сальников, Андрей Саховский, Ирина Никишина, Аида Усманова, Angelie Kraft, Cedric Möller, Debayan Banerjee, Junbo Huang, Longquan Jiang, Rana Abdullah, Xi Yan, Елена Тутубалина, Ricardo Usbeck, Александр Панченко

Читать источник

The benefits of query-based KGQA systems for complex and temporal questions in LLM era

Артем Алексеев, Михаил Чайчук, Мирон Бутко, Александр Панченко, Елена Тутубалина, Олег Сомов

Читать источник

BALI: Enhancing Biomedical Language Representations through Knowledge Graph and Language Model Alignment

Андрей Саховский, Елена Тутубалина

Читать источник

Overview of the 10th Social Media Mining for Health (#SMM4H) and Health Real-World Data (HeaRD) Shared Tasks at ICWSM 2025

Graciela Gonzalez-Hernandez, Dongfang Xu, Takeshi Onishi, Guillermo Lopez-Garcia, Ivan Flores, Ari Klein, Abeed Sarker, Jeanne Powell, Swati Rajwal, Pierre Zweigenbaum, Lisa Raithel, Roland Roller, Philippe Thomas, Елена Тутубалина, Tirthankar Dasgupta, Manjira Sinha, Sudeshna Jana, Sedigh Khademi

Читать источник

SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection

Никита Сушко, Александр Панченко, Елена Тутубалина

Читать источник

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Даниил Московский, Никита Сушко, Сергей Плетенёв, Александр Панченко, Елена Тутубалина

Читать источник

BioASQ at CLEF2025: The thirteenth edition of the large-scale biomedical semantic indexing and question answering challenge

Anastasios Nentidis, Georgios Katsimpras, Anastasia Krithara, Martin Krallinger, Miguel Rodriguez Ortega, Natalia Loukachevitch, Андрей Саховский, Елена Тутубалина, Grigorios Tsoumakas, George Giannakoulas, Alexandra Bekiaridou, Athanasios Samaras, Giorgio Maria Di Nunzio, Nicola Ferro, Stefano Marchesin, Laura Menotti, Gianmaria Silvello, Georgios Paliouras

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ