en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

AINL

Дата публикации

18.04.2025

Авторы

Артём Юдин Дмитрий Корж Матвей Скрипкин Олег Рогов

Поделиться

Clarispeech: LLM-Enhanced Speech Recognition Post-Correction

Deep Learning , Automatic Speech Recognition, Large Language Models, Natural Language Processing, Artificial Intelligence, Speech recognition methods

Аннотация

Recent advances in Automatic Speech Recognition (ASR)have made these systems widely applicable, including in virtual assistantsand web-based interfaces. However, even cutting-edge ASRmodels often produce errors, particularly when adapting to newspeech domains. Conventional solutions involve fine-tuning ASR modelson target-domain data or integrating language models (LMs) torescore predictions. However, joint fine-tuning of ASR and LM modelscan be unstable, demand substantial training data, and sufferfrom alignment issues. Using more sophisticated language models forshallow fusion, especially large language models (LLMs), is impractical,leading to significant computational overhead. In this paper,we address these challenges by focusing on post-transcription corrections,using parameter-efficient fine-tuning of external languagemodels while leaving the ASR system frozen. Our experiments showthat this approach significantly improves accuracy and computationalefficiency. Compared to the baseline ASR system, employingan ASR+LLM configuration reduces the word error rate from 12%to 10%, while increasing computational cost by less than 50%, despitean eightfold rise in the number of parameters.

Похожие публикации

Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

Kristian Kuznetsov, Лаида Кушнарева, Полина Дружинина, Антон Разжигаев, Анастасия Вознюк, Ирина Пионтковская, Евгений Бурнаев, Сергей Баранников

Читать источник

CLEAR: Character Unlearning in Textual and Visual Modalities

Алексей Донцов, Дмитрий Корж, Алексей Жаворонкин, Борис Михеев, Денис Бобков, Айбек Аланов, Олег Рогов, Иван Оселедец, Елена Тутубалина

Читать источник

Hebbian Sparse Autoencoder

Никита Курдюков, Антон Разжигаев

Читать источник

SODAOpt: Socio-Demographic and Textual Adaptive Fusion for Optimizing Developer Task Assignment

Карина Романова, Сергей Сеничев, Лина Вельтман, Иван Насонов, Андрей Кузнецов, Илья Макаров

Читать источник

NTIRE 2025 challenge on UGC video enhancement: Methods and results

Николай Сафонов, Алексей Брынцев, Андрей Москаленко, Дмитрий Куликов, Дмитрий Ватолин, Radu Timofte, Haibo Lei, Qifan Gao, Qing Luo, Yaqing Li, Jie Song, Shaozhe Hao, Meisong Zheng, Jingyi Xu, Chengbin Wu, Jiahui Liu, Ying Chen, Xin Deng, Mai Xu, Peipei Liang, Jie Ma, Junjie Jin, Yingxue Pang, Fangzhou Luo, Kai Chen, Shijie Zhao, Mingyang Wu, Renjie Li, Yushen Zuo, Shengyun Zhong, Zhengzhong Tu

Читать источник

Entropic neural optimal transport via diffusion processes

Никита Гущин, Александр Колесов, Александр Коротин, Дмитрий Ветров, Евгений Бурнаев

Читать источник

Binary Black Box Optimization via Decision Pretrained Transformer

A. Batsheva, Максим Куркин, Илья Зисман, Александр Никулин, Владислав Куренков, Иван Оселедец

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ