en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

KDD

Дата публикации

24.08.2024

Авторы

Булат Ибрагимов Глеб Гусев

Поделиться

Learn Together Stop Apart: An Inclusive Approach to Ensemble Pruning

Ensemble, Boosting, Regularization, Early Stopping, Decision Tree

Аннотация

Gradient Boosting is a leading learning method that builds ensembles and adapts their sizes to particular tasks, consistently delivering top-tier results across various applications. However, determining the optimal number of models in the ensemble remains a critical yet underexplored aspect. Traditional approaches assume a universal ensemble size effective for all data points, which may not always hold true due to data heterogeneity.
This paper introduces an adaptive approach to early stopping in Gradient Boosting, addressing data heterogeneity by assigning different stop moments to different data regions at inference time while still training a common ensemble on the entire dataset. We propose two methods: Direct Supervised Partition (DSP) and Indirect Supervised Partition (ISP). The DSP method uses a decision tree to partition the data based on learning curves, while ISP leverages the dataset's geometric and target distribution characteristics.
An effective validation protocol is developed to determine the optimal number of early stopping regions or detect when the heterogeneity assumption does not hold. Experiments using state-of-the-art implementations of Gradient Boosting, LightGBM, and CatBoost, on standard benchmarks demonstrate that our methods enhance model precision by up to 2%, underscoring the significance of this research direction. This approach does not increase computational complexity and can be easily integrated into existing learning pipelines.

Читать в источнике Cкачать pdf

Похожие публикации

ShortPathQA: A Dataset for Controllable Fusion of Large Language Models with Knowledge Graphs

Михаил Сальников, Андрей Саховский, Ирина Никишина, Аида Усманова, Angelie Kraft, Cedric Möller, Debayan Banerjee, Junbo Huang, Longquan Jiang, Rana Abdullah, Xi Yan, Елена Тутубалина, Ricardo Usbeck, Александр Панченко

Читать источник

The benefits of query-based KGQA systems for complex and temporal questions in LLM era

Артем Алексеев, Михаил Чайчук, Мирон Бутко, Александр Панченко, Елена Тутубалина, Олег Сомов

Читать источник

Memory Efficient LM Compression using Fisher Information from Low-Rank Representations

Даниил Московский, Сергей Плетенёв, Сергей Загоруйко, Александр Панченко

Читать источник

T-Comm: Телекоммуникации и транспорт

ИЗМЕРИТЕЛЬНЫЕ СИГНАЛЫ НА ОСНОВЕ ПЕРЕСТАНОВОЧНЫХ ПОЛИНОМОВ ДЛЯ ВОСПОЛНЕНИЯ ТЕНЗОРОВ КАНАЛА OFDM MIMO

Семен Дорохин, Денис Шувалов, Михаил Макурин, Владимир Ляшев, Иван Оселедец

Читать источник

Statistical Papers

Optimal experimental design: from design point to design region

Martin Bubel, Philipp Seufert, Глеб Карпов, Jan Schwientek, Michael Bortz, Иван Оселедец

Читать источник

CC-CERT: A Probabilistic Approach to Certify General Robustness of Neural Networks

Михаил Паутов, Nurislam Tursynbek, Марина Мунхоева, Никита Муравьёв, Александр Петюшко, Иван Оселедец

Читать источник

Neural Harmonics: Bridging Spectral Embedding and Matrix Completion in Self-Supervised Learning

Марина Мунхоева, Иван Оселедец

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ