Юрий Куратов
Кандидат физико-математических наук, Руководитель группы «Модели с памятью» Лаборатории «Когнитивные системы ИИ» Института AIRI
В 2016 году окончил ФИВТ МФТИ. C 2017 года работает в лаборатории нейронных систем и глубокого обучения МФТИ DeepPavlov. В 2019 стал финалистом соревнования от Amazon Alexa Prize Socialbot Grand Challenge 3. В 2019 году создал первую русскоязычную LLM — RuBERT.
В 2020 году защитил кандидатскую диссертацию по теме «Специализация языковых моделей для применения к задачам обработки естественного языка» и получил степень кандидата физико-математических наук. В 2021 году присоединился к AIRI. В 2025 году получил награду в номинации Научный прорыв года в ИИ на Data Fusion Awards за разработку подходов с рекуррентной памятью, способных обрабатывать длинные контексты в миллионы токенов, и создание бенчмарка BABILong для оценки работы LLM при работе с длинными контекстами. Занимается исследованиями в области новых нейросетевых архитектур и моделей с памятью. Сейчас большинство современных моделей основано на архитектуре трансформер, которая имеет ряд фундаментальных ограничений: по длине контекста, числу последовательных вычислений (эффективной глубине), что ограничивает класс решаемых задач; также остаются проблемы с эффективным дообучением, быстрой адаптацией к новым входам и контекстам и непрерывным обучением без катастрофического забывания. Разрабатывает альтернативные архитектуры и механизмы памяти, которые позволяют преодолеть эти ограничения.