en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Interspeech

Дата публикации

18.09.2022

Авторы

Ivan Shchekotov Павел Андреев Олег Иванов Айбек Аланов Дмитрий Ветров

Поделиться

FFC-SE: Fast Fourier Convolution for Speech Enhancement

Speech Enhancement, Fourier Convolution

Аннотация

Fast Fourier convolution (FFC) is the recently proposed neural operator showing promising performance in several computer vision problems. The FFC operator allows employing large receptive field operations within early layers of the neural network. It was shown to be especially helpful for inpainting of periodic structures which are common in audio processing. In this work, we design neural network architectures which adapt FFC for speech enhancement. We hypothesize that a large receptive field allows these networks to produce more coherent phases than vanilla convolutional models, and validate this hypothesis experimentally. We found that neural networks based on Fast Fourier convolution outperform analogous convolutional models and show better or comparable results with other speech enhancement baselines.

Читать в источнике

Похожие публикации

HyperDomainNet: Universal Domain Adaptation for Generative Adversarial Networks

Айбек Аланов, Вадим Титов, Дмитрий Ветров

Читать источник

Entropic neural optimal transport via diffusion processes

Никита Гущин, Александр Колесов, Александр Коротин, Дмитрий Ветров, Евгений Бурнаев

Читать источник

On Scaled Methods for Saddle Point Problems

Александр Безносиков, Айбек Аланов, Дмитрий Ковалев, Martin Takáč, Александр Гасников

Читать источник

Star-Shaped Denoising Diffusion Probabilistic Models (Extended Abstract)

Андрей Охотин, Дмитрий Молчанов, Владимир Архипкин, Григорий Бартош, Виктор Оганесян, Айбек Аланов, Дмитрий Ветров

Читать источник

HairFastGAN: Realistic and Robust Hair Transfer with a Fast Encoder-Based Approach.

Максим Николаев, Михаил Кузнецов, Дмитрий Ветров, Айбек Аланов

Читать источник

Group and Shuffle: Efficient Structured Orthogonal Parametrization

Михаил Горбунов, Николай Юдин, Вера Соболева, Айбек Аланов, Алексей Наумов, Максим Рахуба

Читать источник

Guide-and-Rescale: Self-Guidance Mechanism for Effective Tuning-Free Real Image Editing

Вадим Титов, Мадина Халматова, Александра Иванова, Дмитрий Ветров, Айбек Аланов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ