en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

CINTI

Дата публикации

12.01.2022

Авторы

Илья Макаров Антон Захаренков

Поделиться

Deep Reinforcement Learning with DQN vs. PPO in VizDoom

Training, Deep learning, Visualization, Three-dimensional displays, Q-learning, Navigation, Distance learning

Аннотация

VizDoom is a flexible and easy-to-use 3D reinforcement learning research platform based on the well-known Doom first-person shooter. The challenge is to create bots that compete in the DeathMatch track, making decisions based solely on visual in-formation from the screen. The paper offers a com-parison of different approaches with reinforcement learning: Q-learning and policy-gradient algorithms. We explore the distributed learning paradigm in re-inforcement learning, and also discuss the differences in speed and quality of convergence when adding an object detection module.

Читать в источнике

Похожие публикации

EAI: Emotional Decision-Making of LLMs in Strategic Games and Ethical Dilemmas

Михаил Мозиков, Никита Северин, Valeria Bodishtianu, Мария Глушанина, Иван Насонов, Даниил Орехов, Владислав Пехотин, Иван Маковецкий, Михаил Баклашкин, Василий Лаврентьев, Аким Цвигун, Денис Турдаков, Татьяна Шаврина, Андрей Савченко, Илья Макаров

Читать источник

Optimizing state monitoring with domain degradation knowledge

Дмитрий Жевненко, Илья Макаров

Читать источник

SODAOpt: Socio-Demographic and Textual Adaptive Fusion for Optimizing Developer Task Assignment

Карина Романова, Сергей Сеничев, Лина Вельтман, Иван Насонов, Андрей Кузнецов, Илья Макаров

Читать источник

MatMuls are Enough for Linear-Time Dense Attention

Andrew Argatkiny, Илья Макаров

Читать источник

Poster Abstract: Minimizing Labeling Efforts for Fault Detection and Diagnosis

Мария Штарк, Александр Кожевников, Петр Иванов, Илья Макаров

Читать источник

Poster Abstract: Exploring the Autoencoder Sequence Pooling

Петр Иванов, Мария Штарк, Александр Кожевников, Илья Макаров

Читать источник

Poster Abstract: Autonomous AI-Driven Grid Protection: Sub-Cycle Fault Response via NPU-Optimized Neural Networks

Александр Коваленко, Алексей Евдаков, Галина Филатова, Андрей Яблоков, Александр Булашов, Илья Макаров

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ