RL Researcher в Cognitive AI Systems в AIRI
Обязанности
Мы приглашаем исследователей в области обучаемых подходов в робототехнике присоединиться к проекту лаборатории Cognitive AI Systems в AIRI, передовом исследовательском институте, специализирующемся на долгосрочных наукоемких проектах в области искусственного интеллекта.
В нашей команде мы фокусируемся на разработке новых нейросетевых архитектур, пост-трансформеров, методов обучения с подкреплением, мультимодальным моделями и планирования поведения. Один из наших текущих проектов состоит в разработке новых VLA архитектур RL методов для управления движением двуруким роботом.
В этом проекте вы будете заниматься исследованием на стыке теории управления, обучения с подкреплением и нейросетевых методов обучения. Ваши задачи будут включать работа на реальном роботе, в симуляторе, анализ и обзор последних статей по теме, разработку новых алгоритмов.
Ваши обязанности:
- Проведение исследований по различным направлениям обучемых методов в робототехнике.
- Участие в выполнении проектов с индустриальными партнерами института; руководство работой по вышеуказанным направлениям в рамках таких проектов.
- Подготовка к публикации статей по материалам исследований, в т.ч. в журналы Q1 из базы Scopus (например, IEEE Robotic and Automation Letters) и на конференции уровня Core A* и A (например, NeurIPS, ICLR, CVPR, ICRA, IROS)
Решаемые задачи: разработка методов обучения с подкреплением и VLA архитектур в задачах манипуляции объектами по визуальной обратной связи.
Требования
Требования:
- Великолепное знание Python (в том числе опыт работ с Python ML+DL фреймворками sklearn, numpy, pandas, pytorch, wandb).
- Знание Docker и ROS.
- Высокая техническая грамотность (алгоритмический базис, опыт решения архитектурных проблем).
- Глубокое понимание ML/DL алгоритмов и базовых основ теории управления.
- Опыт обучения и реализации RL алгоритмов с нуля.
- Ответственность, нацеленность на результат, многозадачность.
Будет большим плюсом:
- Опыт работы с такими симуляторами как Isaas Sim, Gazebo, MuJoCo.
- Опыт работы с современными вычислительными кластерами, включая администрирование и распределение нагрузки.