en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ACL / GenBench

Дата публикации

16.11.2024

Авторы

Антон Разжигаев Максим Куркин Елизавета Гончарова Ирина Абдуллаева Анастасия Лысенко Александр Панченко Андрей Кузнецов Денис Димитров

Поделиться

OmniGen: A Multimodal Benchmark for Generalization Across Text, Visual, and Audio Modalities

Аннотация

We introduce OmniDialog — the first trimodal comprehensive benchmark grounded in a knowledge graph (Wikidata) to evaluate the generalization of Large Multimodal Models (LMMs) across three modalities. Our benchmark consists of more than 4,000 dialogues, each averaging 10 turns, all annotated and cross-validated by human experts. The dialogues in our dataset are designed to prevent shortcut learning by incorporating various formats and misleading or irrelevant multimodal cues. We also evaluate both multimodal and unimodal models to gain insights into how they process modality inputs introduced in the conversation.

Читать в источнике Cкачать pdf

Похожие публикации

ShortPathQA: A Dataset for Controllable Fusion of Large Language Models with Knowledge Graphs

Михаил Сальников, Андрей Саховский, Ирина Никишина, Аида Усманова, Angelie Kraft, Cedric Möller, Debayan Banerjee, Junbo Huang, Longquan Jiang, Rana Abdullah, Xi Yan, Елена Тутубалина, Ricardo Usbeck, Александр Панченко

Читать источник

The benefits of query-based KGQA systems for complex and temporal questions in LLM era

Артем Алексеев, Михаил Чайчук, Мирон Бутко, Александр Панченко, Елена Тутубалина, Олег Сомов

Читать источник

Memory Efficient LM Compression using Fisher Information from Low-Rank Representations

Даниил Московский, Сергей Плетенёв, Сергей Загоруйко, Александр Панченко

Читать источник

Hebbian Sparse Autoencoder

Никита Курдюков, Антон Разжигаев

Читать источник

Clarispeech: LLM-Enhanced Speech Recognition Post-Correction

Артём Юдин, Дмитрий Корж, Матвей Скрипкин, Олег Рогов

Читать источник

SODAOpt: Socio-Demographic and Textual Adaptive Fusion for Optimizing Developer Task Assignment

Карина Романова, Сергей Сеничев, Лина Вельтман, Иван Насонов, Андрей Кузнецов, Илья Макаров

Читать источник

NTIRE 2025 challenge on UGC video enhancement: Methods and results

Николай Сафонов, Алексей Брынцев, Андрей Москаленко, Дмитрий Куликов, Дмитрий Ватолин, Radu Timofte, Haibo Lei, Qifan Gao, Qing Luo, Yaqing Li, Jie Song, Shaozhe Hao, Meisong Zheng, Jingyi Xu, Chengbin Wu, Jiahui Liu, Ying Chen, Xin Deng, Mai Xu, Peipei Liang, Jie Ma, Junjie Jin, Yingxue Pang, Fangzhou Luo, Kai Chen, Shijie Zhao, Mingyang Wu, Renjie Li, Yushen Zuo, Shengyun Zhong, Zhengzhong Tu

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ