en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ICML

Дата публикации

25.06.2024

Авторы

Вячеслав Синий Александр Никулин Владислав Куренков Илья Зисман Сергей Колесников

Поделиться

In-Context Reinforcement Learning for Variable Action Spaces

Аннотация

Recently, it has been shown that transformers pre-trained on diverse datasets with multi-episode contexts can generalize to new reinforcement learning tasks in-context. A key limitation of previously proposed models is their reliance on a predefined action space size and structure. The introduction of a new action space often requires data re-collection and model re-training, which can be costly for some applications. In our work, we show that it is possible to mitigate this issue by proposing the Headless-AD model that, despite being trained only once, is capable of generalizing to discrete action spaces of variable size, semantic content and order. By experimenting with Bernoulli and contextual bandits, as well as a gridworld environment, we show that Headless-AD exhibits significant capability to generalize to action spaces it has never encountered, even outperforming specialized models trained for a specific set of actions on several environment configurations.

Читать в источнике Cкачать pdf

Похожие публикации

Vintix: Action Model via In-Context Reinforcement Learning

Андрей Полубаров, Никита Любайкин, Александр Деревягин, Илья Зисман, Денис Тарасов, Александр Никулин, Владислав Куренков

Читать источник

Workshop ICML 2025 N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs

Илья Зисман, Александр Никулин, Вячеслав Синий, Денис Тарасов, Никита Любайкин, Андрей Полубаров, Игорь Киселев, Владислав Куренков

Читать источник

ICLR World Models

Workshop ICLR 2025 Object-Centric Latent Action Learning

Альбина Клепач, Александр Никулин, Илья Зисман, Денис Тарасов, Александр Деревягин, Андрей Полубаров, Никита Любайкин, Владислав Куренков

Читать источник

Electrostatics from Laplacian Eigenbasis for Neural Network Interatomic Potentials

Максим Жданов, Владислав Куренков

Читать источник

Zero-Shot Adaptation of Behavioral Foundation Models to Unseen Dynamics

Максим Бобрин, Илья Зисман, Александр Никулин, Владислав Куренков, Дмитрий Дылов

Читать источник

Latent Action Learning Requires Supervision in the Presence of Distractors

Александр Никулин, Илья Зисман, Денис Тарасов, Никита Любайкин, Андрей Полубаров, Игорь Киселев, Владислав Куренков

Читать источник

N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs ICLR 2025

Илья Зисман, Александр Никулин, Вячеслав Синий, Денис Тарасов, Никита Любайкин, Андрей Полубаров, Игорь Киселев, Владислав Куренков

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ