Дата публикации
13.03.2026
Поделиться

Middle+ NLP / LLM data scientist

Обязанности

Ищем Middle+ NLP/LLM data scientist в команду медицинского AI. Вы будете развивать LLM-модели и reasoning-контуры для клинических задач и доводить решения до продакшна и научных публикаций: от данных и обучения LLM до воспроизводимых экспериментов, качественного eval, агентных пайплайнов и интеграции в продукт. Важная часть роли - исследовательская работа: постановка гипотез, проведение экспериментов и подготовка научных публикаций по результатам.


  • Проектировать и поддерживать полный цикл улучшения медицинских LLM: сбор, очистка, версионирование данных, обучение и дообучение (SFT, preference-tuning, DPO/ORPO, instruction tuning);
  • Строить датасеты и контуры разметки: схемы и гайдлайны, контроль согласованности, генерация синтетических данных, self-training, анализ ошибок и bias;
  • Разрабатывать LLM-based пайплайны и агентов для медицинских задач: RAG по клиническим рекомендациям и справочникам, tool-calling, маршрутизация, multi-step workflows, оркестрация (LangGraph и мультиагентные фреймворки), guardrails;
  • Создавать и развивать систему оценивания: тест-наборы и бенчмарки, автоматические метрики и LLM-as-a-judge там, где уместно, экспертная валидация с врачами, red-teaming, регрессионные прогоны, A/B тестирование в проде;
  • Проводить исследовательские итерации: формулировать гипотезы, ставить эксперименты, делать ablation-исследования, документировать результаты, готовить научные статьи и доводить материалы до публикации.

Eye

Требования

  • 3+ лет в NLP/ML, уверенный Python: типизация, тестирование, профилирование, аккуратный продакшн-код;
  • Практический опыт обучения и дообучения трансформеров: PyTorch + HuggingFace, понимание Accelerate, DeepSpeed или аналогов;
  • Опыт построения data-pipelines и воспроизводимых экспериментов: датасеты, версии, конфиги, трекинг (MLflow или ClearML), умение делать корректные сравнения;
  • Понимание LLM-систем: retrieval, tool-calling, агенты, деградации качества, галлюцинации, ограничения продакшна;
  • Навыки оценки качества: метрики, бенчмарки, error analysis, ablations, работа с разметкой и экспертной валидацией;
  • Способность писать технические и научные тексты (на английском) и доводить исследовательские результаты до публикаций.

Будет плюсом:

  • Опыт в медицине или биомеде: клинические тексты, ICD-10, клин. рекомендации, понимание доменных рисков;
  • Опыт alignment: preference data, RLHF, DPO, safety eval, hallucination mitigation;
  • Практика продакшн-инференса: vLLM, оптимизация стоимости и задержки, Docker, K8s, мониторинг, трассировка;
  • Опыт с retrieval-стеком: hybrid search, rerankers, FAISS, Elastic, pgvector, продуманное chunking, grounding;
  • Публикации, участие в open-source или соревнованиях.

Технический стек:


  • Python, PyTorch, HuggingFace, Transformers, Accelerate, DeepSpeed, vLLM, FAISS, Elasticsearch, pgvector, LangGraph, LangChain, MLflow, ClearML, Docker, K8s.


Brain

Отправить резюме

Спасибо!

Что-то пошло не так. Попробуйте снова

Присоединяйтесь к AIRI в соцсетях