en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Neuroinformatics

Дата публикации

01.11.2022

Авторы

Артем Жолус Александр Панов Ярослав Ивченков

Поделиться

Addressing Task Prioritization in Model-based Reinforcement Learning

Generalization in RL, Model-based reinforcement learning, Reinforcement learning

Аннотация

World models facilitate sample-efficient reinforcement learning (RL) and, by design, can benefit from the multitask information. However, it is not used by typical model-based RL (MBRL) agents. We propose a data-centric approach to this problem. We build a controllable optimization process for MBRL agents that selectively prioritizes the data used by the model-based agent to improve its performance. We show how this can favor implicit task generalization in a custom environment based on MetaWorld with a parametric task variability. Furthermore, by bootstrapping the agent’s data, our method can boost the performance on unstable environments from DeepMind Control Suite. This is done without any additional data and architectural changes outperforming state-of-the-art visual model-based RL algorithms. Additionally, we frame the approach within the scope of methods that have unintentionally followed the controllable optimization process paradigm, filling the gap of the data-centric task-bootstrapping methods.

Читать в источнике

Похожие публикации

Relational Object-Centric Actor-Critic

Леонид Угадяров, Виталий Воробьёв, Александр Панов

Читать источник

ICLR LLM Reason and Plan

LookPlanGraph: Embodied instruction following method with VLM graph augmentation

Анатолий Онищенко, Алексей Ковалёв, Александр Панов

Читать источник

Accelerating Transformers in Online RL

Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

Re:Frame - Retrieving Experience From Associative Memory

Даниил Зелезецкий, Егор Черепанов, Алексей Ковалёв, Александр Панов

Читать источник

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Егор Черепанов, Никита Качаев, Алексей Ковалёв, Александр Панов

Читать источник

ICLR Robot Learning

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

Никита Качаев, Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding

Алексей Скрынник, Антон Андрейчук, Анатолий Борзилов, Александр Чернявский, Константин Яковлев, Александр Панов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ