Определим, при каких выполняется
Обозначим , и построим графики функций , .
Из условия получаем неравенство . Отсюда . Таким образом, если , то метод сходится к точке минимума функции .
Теорема
Пусть , где положительно определена. Пусть также и - наименьшие и наибольшие собственные числа матрицы . Тогда если шаг спуска , то градиентный спуск с постоянным шагом сходится к точке глобального функции , причем норма , где
Сходимость должна быть самой быстрой, если , где - точка минимума функции . Очевидно, тогда и только тогда, когда . - оптимальный шаг градиентного спуска с постоянным шагом.
Так как , то при оптимальном шаге пуска . Заметим, что , где . - число обусловленности матрицы . Очевидно, . Окончательно получаем такую оценку скорости сходимости градиентного спуска с постоянным оптимальным шагом. .
2 критических случая:
- (если , то это означает, что линии уровня близки к окружностям). Если , то \implies$$\forall k \lVert x^k \rVert \leq 0 , то есть за 1 итерацию будет достигнута точка из любого начального приближения. Если , то говорят, что задача хорошо обусловлена.
- (если , то это означает, что линии уровня - это сильно вытянутые в одном из направлений эллипсы). В этом случае медленно. Если , то говорят, что задача плохо обусловлена.
Метод наискорейшего спуска
Рассмотрим задачу , где и сильно выпукла в (с константой ).
Построим последовательность приближений по правилу , где - антиградиент функции в точке , - точка функции на промежутке .
Условие окончания поиска - выполнение хотя бы одного из неравенств , , , где - параметры точности. При этом полагаем, что .
Свойство метода
(свойство исчерпывающего спуска).
Геометрическая интерпретация. .