en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

AGI

Дата публикации

07.08.2025

Авторы

Артем Прохоренко Петр Кудеров Евгений Дживеликян Александр Панов

Поделиться

Temporal Predictive Coding as World Model for Reinforcement Learning

Аннотация

Partially observable environments pose a fundamental challenge for reinforcement learning (RL), requiring agents to infer hidden states from incomplete sensory input. We propose incorporating Temporal Predictive Coding (TPC) as a world model within RL agents to address this problem. By continuously predicting future observations, TPC builds robust latent representations that capture essential state information and temporal dependencies. We evaluate this approach in grid-world environments with varying levels of perceptual ambiguity. Across multiple tasks, TPC-augmented agents consistently outperform or match strong baselines, including LSTM, RWKV, Clone-Structured Cognitive Graphs (CSCG), and episodic control agents. Analysis of the learned representations shows that TPC effectively disentangles underlying state structure, resolving perceptual aliasing and supporting generalization across time …

Читать в источнике

Похожие публикации

Cramming 1568 Tokens into a Single Vector and Back Again: Exploring the Limits of Embedding Space Capacity

Юрий Куратов, Михаил Архипов, Айдар Булатов, Михаил Бурцев

Читать источник

CrafText Benchmark: Advancing Language Grounding in Complex Multimodal Open-Ended World

Зоя Воловикова, Петр Кудеров, Григорий Горбов, Александр Панов, Алексей Скрынник

Читать источник

IDAT: A Multi-Modal Dataset and Toolkit for Building and Evaluating Interactive Task-Solving Agents

Shrestha Mohanty, Negar Arabzadeh, Andrea Tupini, Yuxuan Sun, Алексей Скрынник, Артем Жолус, Marc-Alexandre Cote, Юлия Киселева

Читать источник

Scientific And Technical Information Processing

Intrinsic Motivation in Model-based Reinforcement Learning: A Brief Review

Артем Латышев, Александр Панов

Читать источник

Relational Object-Centric Actor-Critic

Леонид Угадяров, Виталий Воробьёв, Александр Панов

Читать источник

ICLR LLM Reason and Plan

LookPlanGraph: Embodied instruction following method with VLM graph augmentation

Анатолий Онищенко, Алексей Ковалёв, Александр Панов

Читать источник

Workshop ICLR 2025 Accelerating Transformers in Online RL

Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ