en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Neuroinformatics

Дата публикации

20.10.2024

Авторы

Денис Васильев Артем Латышев Петр Кудеров Nutsu Shiman Александр Панов

Поделиться

Dynamical Distance Adaptation in Goal-Conditioned Model-Based Reinforcement Learning

Аннотация

Goal-conditioned reinforcement learning aims to develop agents capable of reaching any state within a defined environment. Given the diversity of potential goals, reward engineering can become cumbersome. Therefore, designing algorithms that can train without external rewards is beneficial. This approach is formalized as unsupervised goal-conditioned reinforcement learning (UGCRL), wherein the goal space is a subset of the environmental states. To achieve this objective, it is necessary to engineer goal-conditioned rewards. In this work, we analyze goal-conditioned rewards based on distances between states in a model-based setting and examine the behavior of distance functions depending on different representations used to train such distances. We conducted experiments in continuous maze environments. PointMaze environment is a labyrinth with complex topology but simple control, while AntMaze is simple in topology but complex in control. We found that our method showed some improvements in distant goals in PointMaze. In AntMaze, our method demonstrated performance comparable to the baseline.

Читать в источнике

Похожие публикации

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

Юрий Куратов, Айдар Булатов, Пётр Анохин, Иван Родькин, Дмитрий Сорокин, Артем Сорокин, Михаил Бурцев

Читать источник

Re:Frame - Retrieving Experience From Associative Memory

Даниил Зелезецкий, Егор Черепанов, Алексей Ковалёв, Александр Панов

Читать источник

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Егор Черепанов, Никита Качаев, Алексей Ковалёв, Александр Панов

Читать источник

Beyond Bare Queries: Open-Vocabulary Object Retrieval with 3D Scene Graph

Сергей Линок, Татьяна Земскова, Светлана Ладанова, Роман Титков, Дмитрий Юдин

Читать источник

ICLR Robot Learning

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

Никита Качаев, Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding

Алексей Скрынник, Антон Андрейчук, Анатолий Борзилов, Александр Чернявский, Константин Яковлев, Александр Панов

Читать источник

Learning Successor Features with Distributed Hebbian Temporal Memory

Петр Кудеров, Евгений Дживеликян, Александр Панов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ