en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

RecSys

Дата публикации

08.10.2024

Авторы

Глеб Мезенцев Данил Гусак Иван Оселедец Евгений Фролов

Поделиться

Scalable Cross-Entropy Loss for Sequential Recommendations with Large Item Catalogs

Sequential recommendation, cross-entropyloss, negative sampling

Аннотация

Scalability issue plays a crucial role in productionizing modern recommender systems. Even lightweight architectures may suffer from high computational overload due to intermediate calculations, limiting their practicality in real-world applications. Specifically, applying full Cross-Entropy (CE) loss often yields state-of-the-art performance in terms of recommendations quality. Still, it suffers from excessive GPU memory utilization when dealing with large item catalogs. This paper introduces a novel Scalable Cross-Entropy (SCE) loss function in the sequential learning setup. It approximates the CE loss for datasets with large-size catalogs, enhancing both time efficiency and memory usage without compromising recommendations quality. Unlike traditional negative sampling methods, our approach utilizes a selective GPU-efficient computation strategy, focusing on the most informative elements of the catalog, particularly those most likely to be false positives. This is achieved by approximating the softmax distribution over a subset of the model outputs through the maximum inner product search. Experimental results on multiple datasets demonstrate the effectiveness of SCE in reducing peak memory usage by a factor of up to 100 compared to the alternatives, retaining or even exceeding their metrics values. The proposed approach also opens new perspectives for large-scale developments in different domains, such as large language models.

Читать в источнике Cкачать pdf

Похожие публикации

Matematicheskie Zametki

Accelerated algorithm for splitting a vector into two vectors with small uniform norm

Борис Кашин, Иван Оселедец, Alexander Rudikov

Читать источник

AI Diagnostic Assistant (AIDA): A Predictive Model for Diagnoses from Health Records in Clinical Decision Support Systems

Дмитрий Умеренков, Александр Нестеров, Владимир Шапошников, Елена Соколова, Руслан Абрамов, Николай Романенко, Владимир Кох, Марина Кирина, Антон Абросимов, Дмитрий Дылов, Иван Оселедец

Читать источник

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ

K-optimal preconditioners based on approximations of inverse matrices

Иван Оселедец, Екатерина Муравлева

Читать источник

Run LoRA Run: Faster and Lighter LoRA Implementations

Дарья Чернюк, Александр Михалев, Иван Оселедец

Читать источник

CLEAR: Character Unlearning in Textual and Visual Modalities

Алексей Донцов, Дмитрий Корж, Алексей Жаворонкин, Борис Михеев, Денис Бобков, Айбек Аланов, Олег Рогов, Иван Оселедец, Елена Тутубалина

Читать источник

T-Comm: Телекоммуникации и транспорт

ИЗМЕРИТЕЛЬНЫЕ СИГНАЛЫ НА ОСНОВЕ ПЕРЕСТАНОВОЧНЫХ ПОЛИНОМОВ ДЛЯ ВОСПОЛНЕНИЯ ТЕНЗОРОВ КАНАЛА OFDM MIMO

Семен Дорохин, Денис Шувалов, Михаил Макурин, Владимир Ляшев, Иван Оселедец

Читать источник

Statistical Papers

Optimal experimental design: from design point to design region

Martin Bubel, Philipp Seufert, Глеб Карпов, Jan Schwientek, Michael Bortz, Иван Оселедец

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ