Neural-Symbolic Integration in Learning and Planning
Для решения общей проблемы создания гибридных методов обучения и планирования для повышения степени автономности поведения интеллектуальных агентов в человеко-ориентированной среде предлагается решать проблему привязки символов путем разработки такого метода символьной и субсимвольной интеграции, которая бы позволила эффективно использовать сенсорную информацию при генерации последовательности действий агента на концептуальном уровне. Целью проекта является развитие предложенной участниками ранее концепции нейросимвольной интеграции на основе векторно-знаковых архитектур, развитие подхода объектного обучения с подкреплением и концепции одновременного обучения и планирования на базе архитектуры SLAP агента.

Основной задачей, на достижение которой направлен план исследовательских работ по данному проекту является интеграция объектного алгоритма обучения с подкреплением, работающего на основе модели, использующей высокоразмерные представления для кодирования объектной структуры внешней среды, с символьным планированием поведения на основе обновляемой модели.
1 год работ:
Основное направление — разработка интерактивных алгоритмов формирования структурированных высокоразмерных представлений. Работа будет вестись в направлении развития концепции векторно-знаковых архитектур, которые являются развитием векторно-символьных архитектур (VSA).

2 год работ:
Основное направление — разработка методов объектного обучения с подкреплением на основе модели.

3 год работ:
Основное направление — объединенная модель обучения и планирования поведения в человеко-ориентированной среде, развитие идей динамической нейросимвольной интеграции в процессе обучения и планирования.
Работа будет вестись совместно с психологами из ФИЦ ИУ РАН.

В результате работ по проекту планируется опубликовать три статьи на международных конференциях уровня A* по конкретных алгоритмам и две журнальных статьи уровня Q1 с представлением общих интеграционных подходов.
КОМАНДА
|
Константин Яковлев
|
Константин Миронов
|
Дмитрий Юдин
|
Алексей Староверов
публикации
Авторы
Год
Источник
Real-Time Object Navigation with Deep Neural Networks and Hierarchical Reinforcement Learning
Aleksey Staroverov
Dmitry Yudin
Ilya Belkin
Vasily Adeshkin
Yaroslav Solomentsev
Aleksandr Panov
Alexey Skrynnik
Aleksey Staroverov
Ermek Aitygulov
Kirill Aksenov
Vasilii Davydov
Aleksandr Panov
Hierarchical Deep Q-Network from imperfect demonstrations in Minecraft
Anton Andreychuk
Konstantin Yakovlev
Dor Atzmon
Roni Stern
Multi-agent pathfinding with continuous time
Alexey Skrynnik
Aleksey Staroverov
Ermek Aitygulov
Kirill Aksenov
Vasilii Davydov
Aleksandr Panov
Forgetful experience replay in hierarchical reinforcement learning from expert demonstrations
2021
2021
2019
Anton Andreychuk
Konstantin Yakovlev
Eli Boyarski
Roni Stern
Improving Continuous-time Conflict Based Search
2021
2021
Alexey Kovalev
Aleksandr Panov
Evgeny Osipov
Hyperdimensional Representations in Semiotic Approach to AGI
2021