en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

MICCAI

Дата публикации

04.10.2024

Авторы

Мария Бойко Полина Дружинина Георгий Кормаков Александра Беляева Максим Шараев

Поделиться

MEGFormer: enhancing speech decoding from brain activity through extended semantic representations

Decoding speech, Contrastive Learning, Brain-computer interface, CNNtransformer, MEG

Аннотация

Even though multiple studies have examined the decoding of speech from brain activity through non-invasive technologies in recent years, the task still presents a challenge as decoding quality is still insufficient for practical applications. An effective solution could help in the advancement of brain-computer interfaces (BCIs), potentially enabling communication restoration for individuals experiencing speech impairments. At the same time, these studies can provide fundamental insights into how the brain processes speech and sound. One of the approaches for decoding perceived speech involves using a self-supervised model that has been trained using contrastive learning. This model matches segments of the same length from magnetoencephalography (MEG) to audio in a zero-shot way. We improve the method for decoding perceived speech by incorporating a new architecture based on CNN transformer. As a result of proposed modifications, the accuracy of perceived speech decoding increases significantly from the current 69% to 83% and from 67% to 70% on publicly available datasets. Notably, the greatest improvement in accuracy is observed in longer speech fragments that carry semantic meaning, rather than in shorter fragments with sounds and phonemes. Our code is available at https://github.com/maryjis/MEGformer/.

Читать в источнике Cкачать pdf

Похожие публикации

DepthART: Monocular Depth Estimation as Autoregressive Refinement Task

Булат Габдуллин, Нина Коновалова, Николай Патакин, Дмитрий Сенюшкин, Антон Конушин

Читать источник

Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders

Kristian Kuznetsov, Лаида Кушнарева, Полина Дружинина, Антон Разжигаев, Анастасия Вознюк, Ирина Пионтковская, Евгений Бурнаев, Сергей Баранников

Читать источник

CLEAR: Character Unlearning in Textual and Visual Modalities

Алексей Донцов, Дмитрий Корж, Алексей Жаворонкин, Борис Михеев, Денис Бобков, Айбек Аланов, Олег Рогов, Иван Оселедец, Елена Тутубалина

Читать источник

Hebbian Sparse Autoencoder

Никита Курдюков, Антон Разжигаев

Читать источник

Clarispeech: LLM-Enhanced Speech Recognition Post-Correction

Артём Юдин, Дмитрий Корж, Матвей Скрипкин, Олег Рогов

Читать источник

SODAOpt: Socio-Demographic and Textual Adaptive Fusion for Optimizing Developer Task Assignment

Карина Романова, Сергей Сеничев, Лина Вельтман, Иван Насонов, Андрей Кузнецов, Илья Макаров

Читать источник

NTIRE 2025 challenge on UGC video enhancement: Methods and results

Николай Сафонов, Алексей Брынцев, Андрей Москаленко, Дмитрий Куликов, Дмитрий Ватолин, Radu Timofte, Haibo Lei, Qifan Gao, Qing Luo, Yaqing Li, Jie Song, Shaozhe Hao, Meisong Zheng, Jingyi Xu, Chengbin Wu, Jiahui Liu, Ying Chen, Xin Deng, Mai Xu, Peipei Liang, Jie Ma, Junjie Jin, Yingxue Pang, Fangzhou Luo, Kai Chen, Shijie Zhao, Mingyang Wu, Renjie Li, Yushen Zuo, Shengyun Zhong, Zhengzhong Tu

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ