en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ICLR WRL

Дата публикации

24.04.2025

Авторы

Альбина Клепач Александр Никулин Илья Зисман Денис Тарасов Александр Деревягин Андрей Полубаров Никита Любайкин Владислав Куренков

Поделиться

Object-Centric Latent Action Learning

Аннотация

Leveraging vast amounts of internet video data for Embodied AI is currently bottle-necked by the lack of action annotations and the presence of action-correlated distractors. We propose a novel object-centric latent action learning approach, based on VideoSaur and LAPO, that employs self-supervised decomposition of scenes into object representations and annotates video data with proxy-action labels. This method effectively disentangles causal agent-object interactions from irrelevant background noise and reduces the performance degradation of latent action learning approaches caused by distractors. Our preliminary experiments with the Distracting Control Suite show that latent action pretraining based on object decompositions improve the quality of inferred latent actions by x2.7 and efficiency of downstream fine-tuning with a small set of labeled actions, increasing return by x2.6 on average.

Читать в источнике Cкачать pdf

Похожие публикации

N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs ICLR 2025

Илья Зисман, Александр Никулин, Вячеслав Синий, Денис Тарасов, Никита Любайкин, Андрей Полубаров, Игорь Киселев, Владислав Куренков

Читать источник

Yes, Q-learning Helps Offline In-Context RL

Денис Тарасов, Александр Никулин, Илья Зисман, Альбина Клепач, Андрей Полубаров, Никита Любайкин, Александр Деревягин, Игорь Киселев, Владислав Куренков

Читать источник

Binary Black Box Optimization via Decision Pretrained Transformer

A. Batsheva, Максим Куркин, Илья Зисман, Александр Никулин, Владислав Куренков, Иван Оселедец

Читать источник

XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning

Александр Никулин, Илья Зисман, Алексей Земцов, Вячеслав Синий, Владислав Куренков, Сергей Колесников

Читать источник

Identity Curvature Laplace Approximation for Improved Out-of-Distribution Detection

Максим Жданов, Stanislav Dereka, Сергей Колесников

Читать источник

N-Gram Induction Heads for In-Context RL: Improving Stability and Reducing Data Needs

Илья Зисман, Александр Никулин, Андрей Полубаров, Никита Любайкин, Владислав Куренков

Читать источник

XLand-MiniGrid: Scalable Meta-Reinforcement Learning Environments in JAX

Александр Никулин, Владислав Куренков, Илья Зисман, Артём Агарков, Вячеслав Синий, Сергей Колесников

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ