Определим, при каких выполняется

Обозначим , и построим графики функций , .

Из условия получаем неравенство . Отсюда . Таким образом, если , то метод сходится к точке минимума функции .

Теорема

Пусть , где положительно определена. Пусть также и - наименьшие и наибольшие собственные числа матрицы . Тогда если шаг спуска , то градиентный спуск с постоянным шагом сходится к точке глобального функции , причем норма , где

Сходимость должна быть самой быстрой, если , где - точка минимума функции . Очевидно, тогда и только тогда, когда . - оптимальный шаг градиентного спуска с постоянным шагом.

Так как , то при оптимальном шаге пуска . Заметим, что , где . - число обусловленности матрицы . Очевидно, . Окончательно получаем такую оценку скорости сходимости градиентного спуска с постоянным оптимальным шагом. .

2 критических случая:

  1. (если , то это означает, что линии уровня близки к окружностям). Если , то \implies$$\forall k \lVert x^k \rVert \leq 0 , то есть за 1 итерацию будет достигнута точка из любого начального приближения. Если , то говорят, что задача хорошо обусловлена.
  2. (если , то это означает, что линии уровня - это сильно вытянутые в одном из направлений эллипсы). В этом случае медленно. Если , то говорят, что задача плохо обусловлена.

Метод наискорейшего спуска

Рассмотрим задачу , где и сильно выпукла в (с константой ).

Построим последовательность приближений по правилу , где - антиградиент функции в точке , - точка функции на промежутке .

Условие окончания поиска - выполнение хотя бы одного из неравенств , , , где - параметры точности. При этом полагаем, что .

Свойство метода

(свойство исчерпывающего спуска).

Геометрическая интерпретация. .