en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

Nature Biotechnology

Дата публикации

11.10.2024

Авторы

Abdul Muntakim Rafi Дарья Ногина Дмитрий Пензар Dohoon Lee Danyeong Lee Nayeon Kim Sangyeup Kim Dohyeon Kim Yeojin Shin Il-Youp Kwak Георгий Мещеряков Андрей Ландо Арсений Зинкевич Byeong-Chan Kim Juhyun Lee Taein Kang Eeshit Dhaval Vaishnav Payman Yadollahpour Random Promoter DREAM Challenge Consortium Sun Kim Jake Albrecht Aviv Regev Wuming Gong Иван Кулаковский Pablo Meyer Carl G. de Boer

Поделиться

A community effort to optimize sequence-based deep learning models of gene regulation

Аннотация

A systematic evaluation of how model architectures and training strategies impact genomics model performance is needed. To address this gap, we held a DREAM Challenge where competitors trained models on a dataset of millions of random promoter DNA sequences and corresponding expression levels, experimentally determined in yeast. For a robust evaluation of the models, we designed a comprehensive suite of benchmarks encompassing various sequence types. All top-performing models used neural networks but diverged in architectures and training strategies. To dissect how architectural and training choices impact performance, we developed the Prix Fixe framework to divide models into modular building blocks. We tested all possible combinations for the top three models, further improving their performance. The DREAM Challenge models not only achieved state-of-the-art results on our comprehensive yeast dataset but also consistently surpassed existing benchmarks on Drosophila and human genomic datasets, demonstrating the progress that can be driven by gold-standard genomics datasets.

Читать в источнике Cкачать pdf

Похожие публикации

Epigenetics & Chromatin

Direction and modality of transcription changes caused by TAD boundary disruption in Slc29a3/Unc5b locus depends on tissue-specific epigenetic context

Павел Сальников, Полина Белокопытова, Александра Ян, Emil Viesná, Алексей Кораблев, Ирина Серова, Варвара Лукьянчикова, Яна Степанчук, Никита Торгунаков, Савелий Тихомиров, Вениамин Фишман

Читать источник

Diffusion on language model encodings for protein sequence generation

Федор Мещанинов, Павел Страшнов, Андрей Шевцов, Федор Николаев, Никита Иванисенко, Ольга Кардымон, Дмитрий Ветров

Читать источник

Briefings in Bioinformatics

AFToolkit: a framework for molecular modeling of proteins with AlphaFold derived representations

Мария Синдеева, Александр Телепов, Никита Иванисенко, Татьяна Шашкова, Кузьма Храбров, Артем Цыпин, Артур Кадурин, Ольга Кардымон

Читать источник

NAR Genomics and Bioinformatics

Charm is a flexible pipeline to simulate chromosomal rearrangements on Hi-C-like data

Мирослав Нуриддинов, Полина Белокопытова, Вениамин Фишман

Читать источник

GENATATOR: de novo Gene Annotation With DNA Language Model

Алексей Шмелёв, Artem Shadskiy, Юрий Куратов, Михаил Бурцев, Ольга Кардымон, Вениамин Фишман

Читать источник

Searching for Phenotypic Needles in Genomic Haystacks: DNA Language Models for Sex Prediction

Алла Чепурова, Юрий Куратов, Полина Белокопытова, Михаил Бурцев, Вениамин Фишман

Читать источник

Genome Medicine

Combining chromosome conformation capture and exome sequencing for simultaneous detection of structural and single-nucleotide variants

Мария Гридина, Тимофей Лагунов, Полина Белокопытова, Никита Торгунаков, Мирослав Нуриддинов, Артем Нурисламов, Людмила Назаренко, Анна Кашеварова, Мария Лопаткина, Станислав Васильев, Андрей Зуев, Елена Беляева, Ольга Салюкова, Александр Черемных, Наталья Суханова, Марина Минженкова, Жанна Маркова, Нина Демина, Яна Степанчук, Анна Хабарова, Александра Ян, Эмиль Валеев, Галина Кокшарова, Елена Григорьева, Наталья Кох, Татьяна Лукьянова, Юлия Максимова, Елизавета Мусатова, Елена Шабанова, Андрей Кечин, Евгений Храпов, Ульяна Боярских, Оксана Рыжкова, Мария Сунцова, Алина Матросова, Михаил Кароли, Андрей Манахов, Максим Филипенко, Евгений Рогаев, Надежда Шилова, Игорь Лебедев, Вениамин Фишман

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ