Дата публикации
05.10.2022
Поделиться
Middle-Senior NLP Engineer
Обязанности
Разработка Deep Learning моделей и фреймворков для многоязычных NLP-моделей Мы занимаемся трансформерными моделями для задач обработки естественного языка. З
Задачи:
- имплементация и обучение новых state-of-the-art моделей, как для русского языка, так и мультиязычных
- распределенное обучение моделей на суперкомпьютере в сотни GPU
- эксперименты по оценке и интерпретации моделей
работа над созданием новых методов оценки и интерпретации гигантских моделей в десятки миллиардов параметров.
Требования
- хорошее понимание современных архитектур нейронных сетей, Seq2Seq, трансформеры, BERT, GPT, T5 и т.п.;
- опыт работы с Pytorch или TF; мы пишем на Pytorch;
- умение читать и разбирать статьи о новых архитектурах и подходах;
- понимание принципов обучения, тюнинга, оценки deep learning моделей;
- опыт отладки нейронных сетей и модификации архитектур или создания собственных;
- уверенное знание Python, Git, Linux shell. Будет плюсом:
- опыт распределенного обучения на нескольких GPU и серверах;
- опыт работы с CUDA;
- опыт оптимизации или сжатия/дистилляции моделей;
- опыт воспроизведения статей в коде;
- знание C++;
- ШАД;
- наличие публикаций по Deep Learning.
Отправить резюме
people@airi.net
Если у вас остались вопросы о трудоустройстве, напишите команде HR
на почту