en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

WSDM

Дата публикации

10.03.2025

Авторы

Олег Сомов

Поделиться

The generalization and error detection in LLM-based Text-to-SQL systems

Text-to-SQL, distribution shift, generalization, error detection

Аннотация

Text-to-SQL systems streamline human-database interactions, improvingdata retrieval and decision-making. Although large languagemodels (LLMs) can now generate SQL code, challenges withgeneralization and uncontrolled generation hinder their use in production.Text-to-SQL tasks are particularly sensitive to distributionshifts, where performance declines with unfamiliar database elementsor novel queries. Effective systems must maintain quality,measured in terms of generalization (correct processing of noveluser requests) and error detection (identification of incorrect generations).This study empirically assesses LLM-based Text-to-SQLsystems limitations, defining reliable production scenarios. Currentcontributions include a cross-lingual generalization research,study on generative model generalization abilities and the qualityof selective classification for error detection risk under differentdistribution shifts in task of Text-to-SQL.

Читать в источнике

Похожие публикации

ShortPathQA: A Dataset for Controllable Fusion of Large Language Models with Knowledge Graphs

Михаил Сальников, Андрей Саховский, Ирина Никишина, Аида Усманова, Angelie Kraft, Cedric Möller, Debayan Banerjee, Junbo Huang, Longquan Jiang, Rana Abdullah, Xi Yan, Елена Тутубалина, Ricardo Usbeck, Александр Панченко

Читать источник

The benefits of query-based KGQA systems for complex and temporal questions in LLM era

Артем Алексеев, Михаил Чайчук, Мирон Бутко, Александр Панченко, Елена Тутубалина, Олег Сомов

Читать источник

BALI: Enhancing Biomedical Language Representations through Knowledge Graph and Language Model Alignment

Андрей Саховский, Елена Тутубалина

Читать источник

Overview of the 10th Social Media Mining for Health (#SMM4H) and Health Real-World Data (HeaRD) Shared Tasks at ICWSM 2025

Graciela Gonzalez-Hernandez, Dongfang Xu, Takeshi Onishi, Guillermo Lopez-Garcia, Ivan Flores, Ari Klein, Abeed Sarker, Jeanne Powell, Swati Rajwal, Pierre Zweigenbaum, Lisa Raithel, Roland Roller, Philippe Thomas, Елена Тутубалина, Tirthankar Dasgupta, Manjira Sinha, Sudeshna Jana, Sedigh Khademi

Читать источник

SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection

Никита Сушко, Александр Панченко, Елена Тутубалина

Читать источник

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Даниил Московский, Никита Сушко, Сергей Плетенёв, Александр Панченко, Елена Тутубалина

Читать источник

BioASQ at CLEF2025: The thirteenth edition of the large-scale biomedical semantic indexing and question answering challenge

Anastasios Nentidis, Georgios Katsimpras, Anastasia Krithara, Martin Krallinger, Miguel Rodriguez Ortega, Natalia Loukachevitch, Андрей Саховский, Елена Тутубалина, Grigorios Tsoumakas, George Giannakoulas, Alexandra Bekiaridou, Athanasios Samaras, Giorgio Maria Di Nunzio, Nicola Ferro, Stefano Marchesin, Laura Menotti, Gianmaria Silvello, Georgios Paliouras

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ