Senior/Middle NLP Researcher
Обязанности
Мы занимается передовыми исследованиями в области искусственного интеллекта, а также его применения для решения сложных социальных, экономических и научных задач.
Наша миссия – работа над созданием новых и улучшением существующих подходов к решению задач искусственного интеллекта.
Мы ищем человека для проведения исследований с применением больших языковых моделей, графов знаний и многозадачного обучения.
Наша команда занимается прикладными задачами в области NLP - разработкой решений семантического парсинга/информационного поиска, обучением больших языковых моделей, тестированием SoTA решений и анализом ошибок современных моделей машинного обучения.
Цель наших исследований - создание устойчивых, интерпретируемых и эффективных решений по обработке текста. Мы ищем коллегу с академическим или прод. ML опытом для усиления нашей команды. От кандидата мы ожидаем:
- Высокий уровень знания машинного обучения (с упором в современный NLP - трансформеры, LLM, трюки обучения)
- Умение писать хороший код/организовывать ML эксперименты/оценивать существующие решения
- Уметь читать и писать статьи на английском языке
Будет плюсом, если - у вас уже есть степень/есть статьи на известных конфах по NLP/научных журналах/есть опыт публичных выступлений по теме ML или опыт преподавания
Наши задачи:
- Оценка и обучение существующих SoTA решений
- Разработка собственных моделей машинного обучения
Написание статей на топовые конференции по NLP Задачи:
— Создание и развитие open-source проектов
— Проведение научных исследований и публикация статей
— Выступления на научных конференциях — Планирование экспериментов, распределение подзадач
— Генерация идей для исследований
Требования
- Хорошая математическая подготовка и опыт работы на похожей позиции
- Знание структур данных и алгоритмов Понимание текущего состояния области NLP, хорошо знаете и умеете пользоваться классическими подходами, изучаете последние исследования по теме (в частности, LLMs + agents)
- Понимание принципов работы алгоритмов машинного обучения (линейная регрессия, логистическая регрессия, деревья решений, случайный лес, градиентный бустинг) и глубокого обучения (RNN, CNN, LSTM, Transformer), знание метрик для оценки качества
- Хорошее знание и библиотек для анализа данных (, , , SciPy, Matplotlib), практический опыт применения "baseline" NLP стека (nltk, spacy, gensim, transformers, hugginface и т.д.)
- Знание хотя бы одного из Deep Learning фреймворков
- Опыт ведения исследовательской деятельности и написания научных статей
Будет плюсом:
- Научная степень
- Опыт успешного участия в ML соревнованиях (Kaggle, SemEval)