Дата публикации
05.10.2022
Поделиться

Middle-Senior NLP Engineer

Обязанности

Разработка Deep Learning моделей и фреймворков для многоязычных NLP-моделей Мы занимаемся трансформерными моделями для задач обработки естественного языка. З

Задачи:

  • имплементация и обучение новых state-of-the-art моделей, как для русского языка, так и мультиязычных
  • распределенное обучение моделей на суперкомпьютере в сотни GPU
  • эксперименты по оценке и интерпретации моделей
  • работа над созданием новых методов оценки и интерпретации гигантских моделей в десятки миллиардов параметров.


Eye

Требования

  • хорошее понимание современных архитектур нейронных сетей, Seq2Seq, трансформеры, BERT, GPT, T5 и т.п.;
  • опыт работы с Pytorch или TF; мы пишем на Pytorch;
  • умение читать и разбирать статьи о новых архитектурах и подходах;
  • понимание принципов обучения, тюнинга, оценки deep learning моделей;
  • опыт отладки нейронных сетей и модификации архитектур или создания собственных;
  • уверенное знание Python, Git, Linux shell. Будет плюсом:
  • опыт распределенного обучения на нескольких GPU и серверах;
  • опыт работы с CUDA;
  • опыт оптимизации или сжатия/дистилляции моделей;
  • опыт воспроизведения статей в коде;
  • знание C++;
  • ШАД;
  • наличие публикаций по Deep Learning.
Brain

Отправить резюме

Спасибо!

Присоединяйтесь к AIRI в соцсетях