ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ
Исследования в области обучения с подкреплением для получения новых теоретических результатов и применения их на практике. Разработка новых алгоритмов RL. Получение state-of-the-art результатов в популярных тестовых средах.

Улучшение качества решения важных практических задач, например, навигации роботов в сложных средах, автоматизации рутинных задач обработки информации, быстрого решения задач комбинаторной оптимизации, моделирование поведения систем экономических агентов.
направления работы
Существует ряд известных проблем, мешающих эффективному применению RL. Это проблема эффективного исследования сред с редкой наградой, сложности адаптации агентов к изменениям в среде, катастрофическое забывание при переходе в новую среду.

Существуют отдельные способы частично решить эти проблемы, но не существует подхода, позволяющего гибко объединить их в общее решение, позволяющее эффективно применять обучение с подкреплением для сложных задач.

В проекте Synergy RL мы планируем получить новый метод обучения с подкреплением, который объединит отдельные идеи в универсальный фреймворк.
проекты
Synergy RL
Мы открыты к сотрудничеству. Напишите нам, если у вас есть предложение о совместных проектах
КОНТАКТЫ
Лидер направления
Дмитрий Бабаев