en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Nature

Дата публикации

13.03.2023

Авторы

Александр Селиванов Олег Рогов Даниил Чесаков Артем Шелманов Ирина Федулова Дмитрий Дылов

Поделиться

Medical image captioning via generative pretrained transformers

Аннотация

The proposed model for automatic clinical image caption generation combines the analysis of radiological scans with structured patient information from the textual records. It uses two language models, the Show-Attend-Tell and the GPT-3, to generate comprehensive and descriptive radiology records. The generated textual summary contains essential information about pathologies found, their location, along with the 2D heatmaps that localize each pathology on the scans. The model has been tested on two medical datasets, the Open-I, MIMIC-CXR, and the general-purpose MS-COCO, and the results measured with natural language assessment metrics demonstrated its efficient applicability to chest X-ray image captioning.

Читать в источнике

Похожие публикации

Clarispeech: LLM-Enhanced Speech Recognition Post-Correction

Артём Юдин, Дмитрий Корж, Матвей Скрипкин, Олег Рогов

Читать источник

Benchmarking Uncertainty Quantification Methods for Large Language Models with LM-Polygraph

Roman Vashurin, Екатерина Фадеева, Артем Важенцев, Аким Цвигун, Даниил Васильев, Rui Xing, Abdelrahman Boda Sadallah, Людмила Рванова, Сергей Петраков, Александр Панченко, Timothy Baldwin, Preslav Nakov, Максим Панов, Артем Шелманов

Читать источник

Retinopathy Lesions Segmentation Using YOLOv9 and Grad-CAM: An Advanced Approach for Disease Grading and Localization

Nabil Hezil, Ahmed Bouridane, Олег Рогов

Читать источник

Inference-Time Selective Debiasing to Enhance Fairness in Text Classification Models

Глеб Кузьмин, Nemeesh Yadav, Иван Смирнов, Timothy Baldwin, Артем Шелманов

Читать источник

Token-Level Density-Based Uncertainty Quantification Methods for Eliciting Truthfulness of Large Language Models

Артем Важенцев, Людмила Рванова, Иван Лазичный, Александр Панченко, Максим Панов, Timothy Baldwin, Артем Шелманов

Читать источник

NAACL / SemEval

Semeval-2024 task 8: Multigenerator, multidomain, and multilingual black-box machine-generated text detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Chenxi Whitehouse, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

M4GT-Bench: Evaluation Benchmark for Black-Box Machine-Generated Text Detection

Yuxia Wang, Джонибек Мансуров , Petar Ivanov, Jinyan Su, Артем Шелманов, Аким Цвигун, Osama Mohammed Afzal, Tarek Mahmoud, Giovanni Puccetti, Thomas Arnold, Alham Fikri Aji, Nizar Habash, Ирина Гуревич, Preslav Nakov

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ