Adaptive RAG: обзор методов условной генерации на основе контекста

Описание семинара
В последнее время широкое распространение получили методы генерации LLM с помощью поиска (RAG) за счет того, что они помогают лучше отвечать на вопросы про редкие сущности и факты. Однако необходимость использования поиска накладывает значительные вычислительные и инфраструктурные ограничения. В этом докладе мы рассмотрим каким образом можно определить когда использование RAG необходимо, а когда от него можно отказаться и дать ответ только на базе параметрического знания модели. Исследователи проведут обзор существующих решений, таких как Adaptive-RAG, DRAGIN, SeaKR и Rowen, и расскажем об авторском исследовании на эту тему, принятом к публикации на конференции ACL-2025 (https://arxiv.org/abs/2501.12835).
Докладчик

Оппонент
