en

Об институте
Публикации
Блог
Мероприятия
Карьера

en

Источник

ICML

Дата публикации

13.07.2025

Авторы

Александр Тюрин

Поделиться

Toward a Unified Theory of Gradient Descent under Generalized Smoothness

Аннотация

We study the classical optimization problem minx∈Rdf(x) and analyze the gradient descent (GD) method in both nonconvex and convex settings. It is well-known that, under the L-smoothness assumption (∥∇2f(x)∥≤L), the optimal point minimizing the quadratic upper bound f(xk)+⟨∇f(xk),xk+1−xk⟩+L2∥xk+1−xk∥2 is xk+1=xk−γk∇f(xk) with step size γk=1L. Surprisingly, a similar result can be derived under the ℓ-generalized smoothness assumption (∥∇2f(x)∥≤ℓ(∥∇f(x)∥)). In this case, we derive the step sizeγk=∫10dvℓ(∥∇f(xk)∥+∥∇f(xk)∥v).Using this step size rule, we improve upon existing theoretical convergence rates and obtain new results in several previously unexplored setups.

Читать в источнике Cкачать pdf

Похожие публикации

Ringmaster ASGD: The First Asynchronous SGD with Optimal Time Complexity

Artavazd Maranjyan, Александр Тюрин, Peter Richtárik

Читать источник

Physical Review A

High order schemes for solving partial differential equations on a quantum computer

Борис Арсениев, Дмитрий Гуськов, Ричик Сенгупта, Игорь Захаров

Читать источник

Tight Time Complexities in Parallel Stochastic Optimization with Arbitrary Computation Dynamics

Александр Тюрин

Читать источник

From Logistic Regression to the Perceptron Algorithm: Exploring Gradient Descent with Large Step Sizes

Александр Тюрин

Читать источник

Shadowheart SGD: Distributed Asynchronous SGD with Optimal Time Complexity Under Arbitrary Computation and Communication Heterogeneity.

Александр Тюрин, Marta Pozzi, Иван Ильин, Peter Richtárik

Читать источник

Freya PAGE: First Optimal Time Complexity for Large-Scale Nonconvex Finite-Sum Optimization with Heterogeneous Asynchronous Computations

Александр Тюрин, Kaja Gruntkowska, Peter Richtárik

Читать источник

On the Optimal Time Complexities in Decentralized Stochastic Asynchronous Optimization

Александр Тюрин, Peter Richtárik

Читать источник

Научно-исследовательский институт AIRI

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Об институте
Публикации
Блог
Мероприятия
Карьера

event@airi.net

Для приглашений на мероприятия

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ

people@airi.net

По вопросам, связанным с HR

© 2025, AIRI

Присоединяйтесь к AIRI в соцсетях

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

Об институте
Публикации
Блог
Мероприятия
Карьера

Связаться

Присоединяйтесь к AIRI в соцсетях

Вы можете задать нам вопрос или предложить совместный проект в области ИИ

Имя Почта Обращение Я не робот Отправляя форму, я даю согласие на обработку моих персональных данных

Сообщение отправлено.

Спасибо!

Что-то пошло не так. Попробуйте снова

partner@airi.net

По вопросам научного
сотрудничества и партнерства

pr@airi.net

Для журналистов и СМИ