Инженер-исследователь (Research-Engineer) в области RL
Обязанности
Мы приглашаем инженеров-исследователей в области обучения с подкреплением и глубокого обучения присоединиться к команде Adaptive Agents в AIRI — исследовательской группе, работающей над наукоёмкими прикладными проектами в области искусственного интеллекта.
Команда фокусируется на разработке и индустриальном применении современных методов обучения с подкреплением, оптимального контроля и мультимодальных моделей поведения. Мы работаем над задачами, лежащими на стыке research и production: от робототехники и управления беспилотным транспортом до рекомендательных систем и макроэкономического моделирования.
Работа в команде предполагает applied R&D формат: исследовательская проработка методов, их реализация, экспериментальная валидация и, при наличии научной новизны, публикацию результатов на конференциях уровня Core A* / A (NeurIPS, ICLR, ICML, AAAI и др.).
Решаемые задачи:
Вам предстоит работать над практическими R&D-проектами, связанными с построением систем оптимального контроля, планирования и принятия решений.
Задачи могут относиться к различным прикладным доменам (робототехника, мультиагентные системы, беспилотные автомобили, рекомендательные системы) и ключевым является умение переносить и адаптировать методы RL/DL под новые постановки, вникая в специфику предметной области.
Работа включает полный цикл разработки:
- постановку и формализацию задачи;
- выбор и разработку архитектуры решения;
- обучение и экспериментальную оценку моделей;
- интеграцию и валидацию в прикладных или индустриальных условиях;
- при наличии научной новизны — подготовку публикаций совместно с командой.
Проекты отличаются высокой степенью автономности и предполагают возможность влиять на технические и исследовательские решения.
Обязанности:
- Участие в R&D-проектах с индустриальными и академическими партнёрами института, ownership отдельных направлений или компонент решений
- Проведение прикладных исследований в области RL, оптимального контроля и смежных методов
- Разработка, обучение и экспериментальная оценка моделей (RL / DL)
Подготовка публикаций по результатам проектов (при наличии научной новизны)
Требования
- Глубокое практическое владение Python и опыт работы с ML/DL-стеком (PyTorch, NumPy, pandas, sklearn, wandb; опыт с JAX будет плюсом)
- Глубокое понимание ML/DL алгоритмов. Опыт обучения и реализации RL алгоритмов с нуля.
- Широкий технический кругозор и интерес к смежным областям (CV, LLM/VLM, generative models)
- Опыт участия в разработке и внедрении ML/DL/RL-решений в прикладных или индустриальных условиях, понимание принципов оценки качества моделей
- Хорошая инженерная подготовка: алгоритмическое мышление, опыт проектирования решений, владение инструментами разработки (Git, Docker, Linux)
- Самостоятельность, ответственность, умение формализовать задачи и доводить решения до результата
Будет большим плюсом:
- Опыт обучения больших базовых моделей (CV / NLP) в распределённых сетапах (DDP / FSDP) и работы с современными вычислительными кластерами
- Соавторство и опыт подготовки статей для конференций уровня A / A*
- Опыт работы с инфраструктурой (K8s, Airflow), базами данных (PostgreSQL, Redis, MongoDB и др.)
Опыт взаимодействия с индустриальными партнёрами, умение структурировать задачи, формулировать цели и метрики