en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

MICAI

Год публикации

2021

Авторы

Алексей Ковалёв Александр Панов Евгений Осипов Даниил Кириленко

Поделиться

Question Answering for Visual Navigation in Human-Centered Environments

Visual question answering, Semiotic approach, Vector symbolic architecture, Habitat, Visual Navigation

Аннотация

In this paper, we propose an HISNav VQA dataset – a challenging dataset for a Visual Question Answering task that is aimed at the needs of Visual Navigation in human-centered environments. The dataset consists of images of various room scenes that were captured using the Habitat virtual environment and of questions important for navigation tasks using only visual information. We also propose a baseline for a HISNav VQA dataset, a Vector Semiotic Architecture, and demonstrate its performance. The Vector Semiotic Architecture is a combination of a Sign-Based World Model and Vector Symbolic Architectures. The Sign-Based World Model allows representing various aspects of an agent’s knowledge, and Vector Symbolic Architectures serve on a low computational level. The Vector Semiotic Architecture addresses the symbol grounding problem that plays an important role in the Visual Question Answering Task.

Читать в источнике

Похожие публикации

Relational Object-Centric Actor-Critic

Леонид Угадяров, Виталий Воробьёв, Александр Панов

Читать источник

ICLR LLM Reason and Plan

LookPlanGraph: Embodied instruction following method with VLM graph augmentation

Анатолий Онищенко, Алексей Ковалёв, Александр Панов

Читать источник

Accelerating Transformers in Online RL

Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

Re:Frame - Retrieving Experience From Associative Memory

Даниил Зелезецкий, Егор Черепанов, Алексей Ковалёв, Александр Панов

Читать источник

Memory, Benchmark & Robots: A Benchmark for Solving Complex Tasks with Reinforcement Learning

Егор Черепанов, Никита Качаев, Алексей Ковалёв, Александр Панов

Читать источник

ICLR Robot Learning

A New Perspective on Transformers in Online Reinforcement Learning for Continuous Control

Никита Качаев, Даниил Зелезецкий, Алексей Ковалёв, Александр Панов

Читать источник

POGEMA: A Benchmark Platform for Cooperative Multi-Agent Pathfinding

Алексей Скрынник, Антон Андрейчук, Анатолий Борзилов, Александр Чернявский, Константин Яковлев, Александр Панов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ