en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

EACL

Дата публикации

29.03.2024

Авторы

Антон Разжигаев Матвей Михальчук Елизавета Гончарова Иван Оселедец Денис Димитров Андрей Кузнецов

Поделиться

The Shape of Learning: Anisotropy and Intrinsic Dimensions in Transformer-Based Models

Аннотация

In this study, we present an investigation into the anisotropy dynamics and intrinsic dimension of embeddings in transformer architectures, focusing on the dichotomy between encoders and decoders. Our findings reveal that the anisotropy profile in transformer decoders exhibits a distinct bell-shaped curve, with the highest anisotropy concentrations in the middle layers. This pattern diverges from the more uniformly distributed anisotropy observed in encoders. In addition, we found that the intrinsic dimension of embeddings increases in the initial phases of training, indicating an expansion into higher-dimensional space. This fact is then followed by a compression phase towards the end of training with dimensionality decrease, suggesting a refinement into more compact representations. Our results provide fresh insights to the understanding of encoders and decoders embedding properties.

Читать в источнике Cкачать pdf

Похожие публикации

Hebbian Sparse Autoencoder

Никита Курдюков, Антон Разжигаев

Читать источник

T-Comm: Телекоммуникации и транспорт

ИЗМЕРИТЕЛЬНЫЕ СИГНАЛЫ НА ОСНОВЕ ПЕРЕСТАНОВОЧНЫХ ПОЛИНОМОВ ДЛЯ ВОСПОЛНЕНИЯ ТЕНЗОРОВ КАНАЛА OFDM MIMO

Семен Дорохин, Денис Шувалов, Михаил Макурин, Владимир Ляшев, Иван Оселедец

Читать источник

Statistical Papers

Optimal experimental design: from design point to design region

Martin Bubel, Philipp Seufert, Глеб Карпов, Jan Schwientek, Michael Bortz, Иван Оселедец

Читать источник

SODAOpt: Socio-Demographic and Textual Adaptive Fusion for Optimizing Developer Task Assignment

Карина Романова, Сергей Сеничев, Лина Вельтман, Иван Насонов, Андрей Кузнецов, Илья Макаров

Читать источник

CC-CERT: A Probabilistic Approach to Certify General Robustness of Neural Networks

Михаил Паутов, Nurislam Tursynbek, Марина Мунхоева, Никита Муравьёв, Александр Петюшко, Иван Оселедец

Читать источник

Neural Harmonics: Bridging Spectral Embedding and Matrix Completion in Self-Supervised Learning

Марина Мунхоева, Иван Оселедец

Читать источник

Binary Black Box Optimization via Decision Pretrained Transformer

A. Batsheva, Максим Куркин, Илья Зисман, Александр Никулин, Владислав Куренков, Иван Оселедец

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ