en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ICLR / MLGenX

Дата публикации

14.03.2024

Авторы

Юрий Куратов Алексей Шмелёв Вениамин Фишман Ольга Кардымон Михаил Бурцев

Поделиться

Recurrent memory augmentation of GENA-LM improves performance on long DNA sequence tasks

DNA language models, long sequence processing, recurrent models, computational genomics

Аннотация

Utilizing DNA language models based on the transformer architecture represents a significant advancement in the field of computational genomics. However, these models face a critical challenge due to their inherent limitations in handling input lengths comparable to those of individual vertebrate genes (ranging from 104 to 105 nucleotides) and complete genomes (typically around 109 nucleotides). Currently, the architecture with the longest sequence input among publicly available transformer-based DNA language models, GENA-LM, is constrained to a maximum input length of merely 3⋅104 nucleotides. In this study, we investigate the efficacy of the Recurrent Memory Transformer (RMT) in enhancing GENA-LM for multiple genomic analysis tasks that require processing long DNA sequence inputs. Our results demonstrate that augmenting GENA-LMs with RMT leads to a substantial enhancement in performance, particularly in tasks such as species classification and prediction of epigenetic features. This underscores the significance of the recurrent memory approach in advancing the field of computational genomics and its potential for addressing critical challenges associated with processing long sequence inputs.

Читать в источнике Cкачать pdf

Похожие публикации

BABILong: Testing the Limits of LLMs with Long Context Reasoning-in-a-Haystack

Юрий Куратов, Айдар Булатов, Пётр Анохин, Иван Родькин, Дмитрий Сорокин, Артем Сорокин, Михаил Бурцев

Читать источник

NAR Genomics and Bioinformatics

Charm is a flexible pipeline to simulate chromosomal rearrangements on Hi-C-like data

Мирослав Нуриддинов, Полина Белокопытова, Вениамин Фишман

Читать источник

GENATATOR: de novo Gene Annotation With DNA Language Model

Алексей Шмелёв, Artem Shadskiy, Юрий Куратов, Михаил Бурцев, Ольга Кардымон, Вениамин Фишман

Читать источник

Searching for Phenotypic Needles in Genomic Haystacks: DNA Language Models for Sex Prediction

Алла Чепурова, Юрий Куратов, Полина Белокопытова, Михаил Бурцев, Вениамин Фишман

Читать источник

Genome Medicine

Combining chromosome conformation capture and exome sequencing for simultaneous detection of structural and single-nucleotide variants

Мария Гридина, Тимофей Лагунов, Полина Белокопытова, Никита Торгунаков, Мирослав Нуриддинов, Артем Нурисламов, Людмила Назаренко, Анна Кашеварова, Мария Лопаткина, Станислав Васильев, Андрей Зуев, Елена Беляева, Ольга Салюкова, Александр Черемных, Наталья Суханова, Марина Минженкова, Жанна Маркова, Нина Демина, Яна Степанчук, Анна Хабарова, Александра Ян, Эмиль Валеев, Галина Кокшарова, Елена Григорьева, Наталья Кох, Татьяна Лукьянова, Юлия Максимова, Елизавета Мусатова, Елена Шабанова, Андрей Кечин, Евгений Храпов, Ульяна Боярских, Оксана Рыжкова, Мария Сунцова, Алина Матросова, Михаил Кароли, Андрей Манахов, Максим Филипенко, Евгений Рогаев, Надежда Шилова, Игорь Лебедев, Вениамин Фишман

Читать источник

Optical Memory and Neural Networks

Mastering Long-Context Multi-Task Reasoning With Transformers and Recurrent Memory

Айдар Булатов, Юрий Куратов, Михаил Бурцев

Читать источник

Nucleic Acids Research

GENA-LM: A Family of Open-Source Foundational DNA Language Models for Long Sequences

Вениамин Фишман, Юрий Куратов, Алексей Шмелёв, Максим Петров, Дмитрий Пензар, Денис Шепелин, Николай Чеканов, Ольга Кардымон, Михаил Бурцев

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ