en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

NLDB

Дата публикации

26.06.2024

Авторы

Елисей Рыков Егор Малкершин Александр Панченко

Поделиться

S3: A Simple Strong Sample-effective Multimodal Dialog System

LLM, Multimodality, VQA, AQA

Аннотация

In this work, we present a conceptually simple yet powerful baseline for the multimodal dialog task, an S3 model, that achieves near state-of-the-art results on two compelling leaderboards: MMMU and AI Journey Contest 2023. The system is based on a pre-trained large language model, pre-trained modality encoders for image and audio, and a trainable modality projector. The proposed effective data mixture for training such an architecture demonstrates that a multimodal model based on a strong language model and trained on a small amount of multimodal data can perform efficiently in the task of multimodal dialog.

Читать в источнике Cкачать pdf

Похожие публикации

Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph

Roman Vashurin, Екатерина Фадеева, Артем Важенцев, Аким Цвигун, Даниил Васильев, Rui Xing, Abdelrahman Boda Sadallah, Людмила Рванова, Сергей Петраков, Александр Панченко, Timothy Baldwin, Preslav Nakov, Максим Панов, Артем Шелманов

Читать источник

SkipCLM: Enchancing Crosslingual Alignment of Decoder Transformer Models via Contrastive Learning and Skip Connection

Никита Сушко, Александр Панченко, Елена Тутубалина

Читать источник

Through the Looking Glass: Common Sense Consistency Evaluation of Weird Images

Елисей Рыков, Ксения Петрушина, Ксения Титова, Антон Разжигаев, Александр Панченко, Василий Коновалов

Читать источник

How Much Knowledge Can You Pack into a LoRA Adapter without Harming LLM?

Сергей Плетенёв, Мария Марьина, Даниил Московский, Василий Коновалов, Павел Браславский, Александр Панченко, Михаил Сальников

Читать источник

Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models

Артем Важенцев, Людмила Рванова, Иван Лазичный, Александр Панченко, Максим Панов, Timothy Baldwin, Артем Шелманов

Читать источник

SynthDetoxM: Modern LLMs are Few-Shot Parallel Detoxification Data Annotators

Даниил Московский, Никита Сушко, Сергей Плетенёв, Александр Панченко, Елена Тутубалина

Читать источник

SPY: Enhancing Privacy with Synthetic PII Detection Dataset

Максим Савкин, Тимур Ионов, Василий Коновалов

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ