Дата публикации
26.12.2025
Поделиться

Инженер-исследователь (Research-Engineer) в области RL

Обязанности

Мы приглашаем инженеров-исследователей в области обучения с подкреплением и глубокого обучения присоединиться к команде Adaptive Agents в AIRI — исследовательской группе, работающей над наукоёмкими прикладными проектами в области искусственного интеллекта.

Команда фокусируется на разработке и индустриальном применении современных методов обучения с подкреплением, оптимального контроля и мультимодальных моделей поведения. Мы работаем над задачами, лежащими на стыке research и production: от робототехники и управления беспилотным транспортом до рекомендательных систем и макроэкономического моделирования.

Работа в команде предполагает applied R&D формат: исследовательская проработка методов, их реализация, экспериментальная валидация и, при наличии научной новизны, публикацию результатов на конференциях уровня Core A* / A (NeurIPS, ICLR, ICML, AAAI и др.).

Решаемые задачи:

Вам предстоит работать над практическими R&D-проектами, связанными с построением систем оптимального контроля, планирования и принятия решений.

Задачи могут относиться к различным прикладным доменам (робототехника, мультиагентные системы, беспилотные автомобили, рекомендательные системы) и ключевым является умение переносить и адаптировать методы RL/DL под новые постановки, вникая в специфику предметной области.

Работа включает полный цикл разработки:


  • постановку и формализацию задачи;
  • выбор и разработку архитектуры решения;
  • обучение и экспериментальную оценку моделей;
  • интеграцию и валидацию в прикладных или индустриальных условиях;
  • при наличии научной новизны — подготовку публикаций совместно с командой.

Проекты отличаются высокой степенью автономности и предполагают возможность влиять на технические и исследовательские решения.



Обязанности:


  • Участие в R&D-проектах с индустриальными и академическими партнёрами института, ownership отдельных направлений или компонент решений
  • Проведение прикладных исследований в области RL, оптимального контроля и смежных методов
  • Разработка, обучение и экспериментальная оценка моделей (RL / DL)
  • Подготовка публикаций по результатам проектов (при наличии научной новизны)

Eye

Требования

  • Глубокое практическое владение Python и опыт работы с ML/DL-стеком (PyTorch, NumPy, pandas, sklearn, wandb; опыт с JAX будет плюсом)
  • Глубокое понимание ML/DL алгоритмов. Опыт обучения и реализации RL алгоритмов с нуля.
  • Широкий технический кругозор и интерес к смежным областям (CV, LLM/VLM, generative models)
  • Опыт участия в разработке и внедрении ML/DL/RL-решений в прикладных или индустриальных условиях, понимание принципов оценки качества моделей
  • Хорошая инженерная подготовка: алгоритмическое мышление, опыт проектирования решений, владение инструментами разработки (Git, Docker, Linux)
  • Самостоятельность, ответственность, умение формализовать задачи и доводить решения до результата

Будет большим плюсом:


  • Опыт обучения больших базовых моделей (CV / NLP) в распределённых сетапах (DDP / FSDP) и работы с современными вычислительными кластерами
  • Соавторство и опыт подготовки статей для конференций уровня A / A*
  • Опыт работы с инфраструктурой (K8s, Airflow), базами данных (PostgreSQL, Redis, MongoDB и др.)
  • Опыт взаимодействия с индустриальными партнёрами, умение структурировать задачи, формулировать цели и метрики

Brain

Отправить резюме

Спасибо!

Что-то пошло не так. Попробуйте снова

Присоединяйтесь к AIRI в соцсетях