en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

IJCAI

Дата публикации

03.08.2024

Авторы

Михаил Паутов Никита Богданов Станислав Пяткин Олег Рогов Иван Оселедец

Поделиться

Probabilistically Robust Watermarking of Neural Networks

Machine Learning: ML: Adversarial machine learning, AI Ethics, Trust, Fairness: ETF: Safety and robustness, AI Ethics, Trust, Fairness: ETF: Trustworthy AI, Uncertainty in AI: UAI: Applications

Аннотация

As deep learning (DL) models are widely and effectively used in Machine Learning as a Service (MLaaS) platforms, there is a rapidly growing interest in DL watermarking techniques that can be used to confirm the ownership of a particular model. Unfortunately, these methods usually produce watermarks susceptible to model stealing attacks. In our research, we introduce a novel trigger set-based watermarking approach that demonstrates resilience against functionality stealing attacks, particularly those involving extraction and distillation. Our approach does not require additional model training and can be applied to any model architecture. The key idea of our method is to compute the trigger set, which is transferable between the source model and the set of proxy models with a high probability. In our experimental study, we show that if the probability of the set being transferable is reasonably high, it can be effectively used for ownership verification of the stolen model. We evaluate our method on multiple benchmarks and show that our approach outperforms current state-of-the-art watermarking techniques in all considered experimental setups.

Читать в источнике Cкачать pdf

Похожие публикации

Matematicheskie Zametki

Accelerated algorithm for splitting a vector into two vectors with small uniform norm

Борис Кашин, Иван Оселедец, Alexander Rudikov

Читать источник

Computer Vision and Image Understanding

Stochastic BIQA: Median Randomized Smoothing for Certified Blind Image Quality Assessment

Екатерина Шумицкая, Михаил Паутов, Дмитрий Ватолин, Анастасия Анциферова

Читать источник

AI Diagnostic Assistant (AIDA): A Predictive Model for Diagnoses from Health Records in Clinical Decision Support Systems

Дмитрий Умеренков, Александр Нестеров, Владимир Шапошников, Елена Соколова, Руслан Абрамов, Николай Романенко, Владимир Кох, Марина Кирина, Антон Абросимов, Дмитрий Дылов, Иван Оселедец

Читать источник

Novel Loss-Enhanced Universal Adversarial Patches for Sustainable Speaker Privacy

Эльвир Каримов, Александр Варламов, Данил Иванов, Дмитрий Корж, Олег Рогов

Читать источник

ЖУРНАЛ ВЫЧИСЛИТЕЛЬНОЙ МАТЕМАТИКИ И МАТЕМАТИЧЕСКОЙ ФИЗИКИ

K-optimal preconditioners based on approximations of inverse matrices

Иван Оселедец, Екатерина Муравлева

Читать источник

Run LoRA Run: Faster and Lighter LoRA Implementations

Дарья Чернюк, Александр Михалев, Иван Оселедец

Читать источник

CLEAR: Character Unlearning in Textual and Visual Modalities

Алексей Донцов, Дмитрий Корж, Алексей Жаворонкин, Борис Михеев, Денис Бобков, Айбек Аланов, Олег Рогов, Иван Оселедец, Елена Тутубалина

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ