Название: Классические методы безусловной оптимизации
Вид работы: реферат
Рубрика: Математика
Размер файла: 537.09 Kb
Скачать файл: referat.me-214682.docx
Краткое описание работы: ТЕМА Классические методы безусловной оптимизации Введение Как известно, классическая задача безусловной оптимизации имеет вид: Существуют аналитические и численные методы решения этих задач.
Классические методы безусловной оптимизации
ТЕМА
Классические методы безусловной оптимизации
Введение
Как известно, классическая задача безусловной оптимизации имеет вид:
(1)
(2)
Существуют аналитические и численные методы решения этих задач.
Прежде всего вспомним аналитические методы решения задачи безусловной оптимизации.
Методы безусловной оптимизации занимают значительное место в курсе МО. Это обусловлено непосредственным применением их при решении ряда оптимизационных задач, а также при реализации методов решения значительной части задач условной оптимизации (задач МП).
1. Необходимые условия для точки локального минимума (максимума)
Пусть т.
доставляет минимальные значения функции
. Известно, что в этой точке приращение функции неотрицательно, т.е.
. (1)
Найдем
, используя разложения функции
в окрестности т.
в ряд Тейлора.
, (2)
где
,
,
- сумма членов ряда порядок которых относительно приращений
(двум) и выше.
Из (2) имеем:
(3)
Далее предположим, что изменяется только одна переменная из множества переменных
. Например,
, тогда (3) преобразуется к виду:
(4)
Из (4) с очевидностью следует, что
(5)
Предположим, что
, тогда
(6)
С учетом (6) имеем:
. (7)
Предположим, что
положительно, т.е.
. Выберем при этом
, тогда произведение
, что противоречит (1).
Поэтому, действительно,
очевиден.
Рассуждая аналогично относительно других переменных
получаем необходимое условие для точек локального минимума функции многих переменных
![]()
(8)
Легко доказать, что для точки локального максимума необходимые условия будут точно такими же, как и для точки локального минимуму, т.е. условиями (8).
Понятно, что итогом доказательства будет неравенство вида:
- условие неположительного приращения функции в окрестности локального максимума.
Полученные необходимые условия не дают ответ на вопрос: является ли стационарная точка
точкой минимума или точкой максимума.
Ответ на этот вопрос можно получить, изучив достаточные условия. Эти условия предполагают исследование матрицы вторых производных целевой функции
.
2. Достаточные условия для точки локального минимума (максимума)
Представим разложение функции
в окрестности точки
в ряд Тейлора с точностью до квадратичных по
слагаемых.
(1)
Разложение (1) можно представить более кратко, используя понятие: "скалярное произведение векторов" и "векторно-матричное произведение".
(1')


![]()
- матрица двух производных от целевой функции по соответствующим переменным.
, ![]()
Приращение функции
на основании (1') можно записать в виде:
(3)
Учитывая необходимые условия:
,
(4)
Подставим (3) в виде:
(4')
(5)
Квадратичная форма
называется дифференциальной квадратичной формой (ДКФ).
Если ДКФ положительно определена, то
и стационарная точка
является точкой локального минимума.
Если же ДКФ и матрица
, ее представляющая, отрицательно определены, то
и стационарная точка
является точкой локального максимума.
Итак, необходимое и достаточное условие для точки локального минимума имеют вид

(эти же необходимые условия можно записать так:
,
,
)
- достаточное условие.
Соответственно, необходимое и достаточное условие локального максимума имеет вид:
,
(
),
.
Вспомним критерий, позволяющий определить: является ли квадратичная форма и матрица, ее представляющая, положительно определенной, или отрицательно определенной.
3. Критерий Сильвестра
Позволяет ответить на вопрос: является ли квадратичная форма и матрица, ее представляющая, положительно определенной, или отрицательно определенной.
Далее изложение будет относительно ДКФ и матрицы
ее определяющей, т.е. ДКФ вида
.
,
- называется матрицей Гессе.

Главный определитель матрицы Гессе ![]()
![]()


![]()
и ДКФ, которую оно представляет, будут положительно определенными, если все главные определители матрицы Гессе (
) положительны (т.е. имеет место следующая схема знаков:
)
Если же имеет место другая схема знаков для главных определителей матрицы Гессе
, например,
, то матрица
и ДКФ отрицательно определены.
4. Метод Эйлера – классический метод решения задач безусловной оптимизации
Этот метод основан на необходимых и достаточных условиях, изученных в 1.1 – 1.3; применим нахождению локальных экстремумов только непрерывных дифференцируемых функций.
Алгоритм этого метода достаточно прост:
1) используя необходимые условия формируем систему
в общем случае нелинейных уравнений. Отметим, что решить аналитически эту систему в общем случае невозможно; следует применить численные методы решения систем нелинейных уравнений (НУ) (см. "ЧМ"). По этой причине метод Эйлера будет аналитически-численным методом. Решая указанную систему уравнений находим координаты стационарной точки
.;
2) исследуем ДКФ и матрицу Гессе
, которая ее представляет. С помощью критерия Сильвестра определяем, является ли стационарная точка
точкой минимума или точкой максимума;
3) вычисляем значение целевой функции
в экстремальной точке
![]()
Методом Эйлера решить следующую задачу безусловной оптимизации: найти 4 стационарные точки функции вида:
![]()
Выяснить характер этих точек, являются ли они точками минимума, или Седловыми (см. [3]). Построить графическое отображение этой функции в пространстве и на плоскости (с помощью линий уровня).
Далее эту функцию будем именовать типовой функцией, исследуя ее экстремальные свойства всеми изученными методами.
5. Классическая задача условной оптимизации и методы ее решения: Метод исключения и Метод множителей Лагранжа (ММЛ)
Как известно, классическая задача условной оптимизации имеет вид:
(1)
(2)
График, поясняющий постановку задачи (1), (2) в пространстве
.
(1')
(2')
, ![]()

- уравнения линий уровня
Итак, ОДР
в рассматриваемой задаче представляет собой некоторую кривую, представленную уравнением (2').
Как видно из рисунка, точка
является точкой безусловного глобального максимума; точка
- точкой условного (относительного) локального минимума; точка
- точка условного (относительного) локального максимума.
Задачу (1'), (2') можно решить методом исключения (подстановки), решив уравнение (2') относительно переменной
, и подставляя найденное решение (1').
![]()
Исходная задача (1'), (2') таким образом преобразована в задачу безусловной оптимизации функции
, которую легко решить методом Эйлера.
Метод исключения (подстановки).
Пусть целевая функция зависит от
переменных:
![]()
![]()
называются зависимыми переменными (или переменными состояния); соответственно можно ввести вектор

Оставшиеся
переменных
называются независимыми переменными решения.
Соответственно можно говорить о вектор-столбце:
и вектора
.
В классической задаче условной оптимизации:
(1)
(2)
Система (2) в соответствии с методом исключения (подстановки) должна быть разрешена относительно зависимых переменных (переменных состояния), т.е. должны быть получены следующие выражения для зависимых переменных:
(3)
Всегда ли система уравнений (2) разрешима относительно зависимых переменных
- не всегда, это возможно лишь в случае, когда определитель
, называемый якобианом, элементы которого имеют вид:
, ![]()
не равен нулю (см. соответствующую теорему в курсе МА)

Как видно, функции
,
должны быть непрерывными дифференцируемыми функциями, во-вторых, элементы определителя
должны быть вычислены в стационарной точке целевой функции.
Подставляем
из (3) в целевую функцию (1), имеем:
![]()
(5)
Исследуемая функция
на экстремум можно произвести методом Эйлера – методом безусловной оптимизации непрерывно дифференцируемой функции.
Итак, метод исключения (подстановки) позволяет использовать задачу классической условной оптимизации преобразовать в задачу безусловной оптимизации функции
- функции
переменных при условии (4), позволяющим получить систему выражений (3).
Недостаток метода исключения: трудности, а иногда и невозможность получения системы выражений (3). Свободный от этого недостатка, но требующий выполнения условия (4)
является ММЛ.
5.2. Метод множителей Лагранжа. Необходимые условия в классической задаче условной оптимизации. Функция Лагранжа ![]()
ММЛ позволяет исходную задачу классической условной оптимизации:
(1)
(2)
Преобразовать в задачу безусловной оптимизации специально сконструированной функции – функции Лагранжа:
, (3)
где
,
- множители Лагранжа;
.
Как видно,
представляет собой сумму, состоящую из исходной целевой функции
и "взвешенной" суммы функций
,
- функции, представляющие их ограничения (2) исходной задачи.
Пусть точка
- точка безусловного экстремума функции
, тогда, как известно,
,
, или
(полный дифференциал функции
в точке
).
Используя концепция зависимых и независимых переменных
- зависимые переменные;
- независимые переменные, тогда представим (5) в развернутом виде:
(5')
Из (2) с очевидностью следует система уравнений вида:
,
(6)
Результат вычисления полного дифференциала для каждой из функций
![]()
Представим (6) в "развернутом" виде, используя концепцию зависимых и независимых переменных:
,
(6')
Заметим, что (6') в отличии от (5') представляет собой систему, состоящую из
уравнений.
Умножим каждое
-ое уравнение системы (6') на соответствующий
-ый множитель Лагранжа. Сложим их между собой и с уравнением (5') и получим выражение:

(7)
Распорядимся множителями Лагранжа
таким образом, чтобы выражение в квадратных скобках под знаком первой суммы (иными словами, коэффициенты при дифференциалах независимых переменных
,
) равнялось нулю.
Термин "распорядимся" множителями Лагранжа вышеуказанным образом означает, что необходимо решить некоторую систему из
уравнений относительно
.
Структуру такой системы уравнений легко получить приравняв выражение в квадратной скобке под знаком первой суммы нулю:
,
(8)
Перепишем (8) в виде
,
(8')
Система (8') представляет собой систему из
линейных уравнений относительно
известных:
. Система разрешима, если
(вот почему, как и в методе исключения в рассматриваемом случае должно выполняться условие
). (9)
Поскольку в ключевом выражении (7) первая сумма равна нулю, то легко понять, что и вторая сумма будет равняться нулю, т.е. имеет место следующая система уравнений:
(10)
Система уравнений (8) состоит из
уравнений, а система уравнений (10) состоит из
уравнений; всего
уравнений в двух системах, а неизвестных
:
, ![]()
Недостающие
уравнений дает система уравнений ограничений (2):
, ![]()
Итак, имеется система из
уравнений для нахождения
неизвестных:
(11)
Полученный результат – система уравнений (11) составляет основное содержание ММЛ.
Легко понять, что систему уравнений (11) можно получить очень просто, вводя в рассмотрение специально сконструированную функцию Лагранжа (3).
Действительно
,
(12)
,
(13)
Итак, система уравнений (11) представима в виде (используя (12), (13)):
(14)
Система уравнений (14) представляет необходимое условие в классической задаче условной оптимизации.
Найденное в результате решение этой системы значение вектора
называется условно-стационарной точкой.
Для того, чтобы выяснить характер условно-стационарной точки
необходимо воспользоваться достаточными условиями.
5.3 Достаточные условия в классической задаче условной оптимизации. Алгоритм ММЛ
Эти условия позволяют выяснить, является ли условно-стационарная точка
точкой локального условного минимума, или точкой локального условного максимума.
Относительно просто, подобно тому, как были получены достаточные условия в задаче на безусловный экстремум. Можно получить достаточные условия и в задаче классической условной оптимизации.
Результат этого исследования:
![]()
где
- точка локального условного минимума.
![]()
где
- точка локального условного максимума,
- матрица Гессе с элементами
, ![]()
Матрица Гессе
имеет размерность
.
Размерность матрицы Гессе
можно уменьшить, используя условие неравенства нулю якобиана:
. При этом условии можно зависимые переменные
выразить через независимые переменные
, тогда матрица Гессе будет иметь размерность
, т.е. необходимо говорить о матрице
с элементами
, ![]()
тогда достаточные условия будут иметь вид:
,
- точка локального условного минимума.
,
- точка локального условного максимума.
Доказательство: Алгоритм ММЛ:
1) составляем функцию Лагранжа:
;
2) используя необходимые условия, формируем систему уравнений:

3) из решения этой системы находим точку
;
4) используя достаточные условия, определяем, является ли точка
точкой локального условного минимума или максимума, затем находим
![]()
1.5.4. Графо-аналитический метод решения классической задачи условной оптимизации в пространстве
и его модификации при решении простейших задач ИП и АП
Этот метод использует геометрическую интерпретацию классической задачи условной оптимизации и основан на ряде важных фактов, присущих этой задаче.

;
;
;
![]()
![]()
В
- общая касательная для функции
и функции
, представляющей ОДР
.
Как видно из рисунка точка
- точка безусловного минимума, точка
точка условного локального минимума, точка
- точка условного локального максимума.
Докажем, что в точках условных локальных экстремумов кривая
и соответствующие линии уровня
;
.
Из курса МА известно, что в точке касания выполняется условие
![]()
где
- угловой коэффициент касательной, проведенной соответствующей линией уровня;
- угловой коэффициент касательной, проведенной к функции
![]()
Известно выражение (МА) для этих коэффициентов:
; 
Докажем, что эти коэффициенты равны.

; ![]()
потому что об этом "говорят" необходимые условия

.
Вышесказанное позволяет сформулировать алгоритм ГФА метода решения классической задачи условной оптимизации:
1) строим семейство линий уровня целевой функции:
;
;
2) строим ОДР, используя уравнение ограничения
![]()
3) с целью внесения исправления возрастания функции
, находим
и выясняем характер экстремальных точек;
4) исследуем взаимодействие линий уровня и функции
, находя при этом из системы уравнений
координаты условно стационарных точек – локальных условных минимумов и локальных условных максимумов.
5) вычисляем
![]()
Следует особо отметить, что основные этапы ГФА метода решения классической задачи условной оптимизации совпадают с основными этапами ГФА метода решения задач НП и ЛП, отличие лишь в ОДР
, а также в нахождении местоположения экстремальных точек в ОДР (например, в задачах ЛП эти точки обязательно находятся в вершинах выпуклого многоугольника, представляющего ОДР
).
5.5. О практическом смысле ММЛ
Представим классическую задачу условной оптимизации в виде:
(1)
(2)
где
- переменные величины, представляющие в прикладных технических и экономических задачах переменные ресурсы.
В пространстве
задача (1), (2) принимает вид:
(1')
![]()
где
- переменная величина. (2')
Пусть
- точка условного экстремума:

При изменении
изменяется
, т.е. ![]()
Соответственно изменится и значение целевой функции:
![]()
Вычислим производную:
. (3)
(4)
(5)
Из (3), (4), (5)![]()
. (6)
Из (5)![]()
. (5')
Подставим (5') в (3) и получаем:
(6')
Из (6)
, что множитель Лагранжа
характеризует "реакцию" значение
(ортогональна значению целевой функции) на изменения параметра
.
В общем случае (6) принимает вид:
;
(7)
Из (6), (7)
, что множитель
,
характеризует изменение
при изменении соответствующего
-того ресурса на 1.
Если
- максимальная прибыль или минимальная стоимость, то
,
характеризует изменения этой величины при изменении
,
на 1.
5.6. Классическая задача условной оптимизации, как задача о нахождении седловой точки функции Лагранжа: ![]()
Пара
называется седловой точкой, если выполняется неравенство.
(1)
Очевидно, что из (1)![]()
. (2)
Из (2)
, что
. (3)
Как видно система (3) содержит
уравнений, подобных тем
уравнениям, которые представляют необходимое условие в классической задаче условной оптимизации:
(4)
где
- функция Лагранжа.
В связи с аналогией систем уравнений (3) и (4), классическую задачу условной оптимизации можно рассматривать как задачу о нахождении седловой точки функции Лагранжа.
Похожие работы
-
Типовой расчет графов
Данная работа является типовым расчетом по курсу "Дискретная математика" по теме "Графы", предлагаемая студентам МГТУ им. Баумана.
-
Нелинейная теория функции Зильберта в частных производных
Министерство Образования и Науки Украины Харьковский национальный университет имени Н.Н. Зильберта А.А. Тензор, В.В. Невязкин Нелинейная теория функции Зильберта
-
Основные понятия и решения моделирования
Юридический техникум Рассмотрено и одобрено ПЦК г. Кропоткин программирования Председатель ПЦК Покалицына О.В. План чтения лекции по учебной дисциплине
-
Математическая модель распределения информации
Математическая модель распределения информации Математическая модель системы распределения информации включает следующие три основных элемента: входящий поток вызовов (требований на обслуживание), схему системы распределения информации, дисциплину обслуживания потока вызовов.
-
Сравнительный анализ методов оптимизации
Математическая задача оптимизации. Минимум функции одной и многих переменных. Унимодальные и выпуклые функции. Прямые методы безусловной оптимизации и минимизации, их практическое применение. Методы деления отрезка пополам (дихотомия) и золотого сечения.
-
Методы спуска
Решение задач безусловной минимизации методами спуска: метод градиентного и покоординатного спуска.
-
Экзаменационные билеты по методам оптимизации за весенний семестр 2001 года
примерный перечень экзаменационных вопросов методы оптимизации Сформулируйте понятие «оптимизации». Приведите примеры сфер деятельности, где можно использовать методы оптимизации.
-
Модели и методы принятия решений
Нахождение экстремумов функций методом множителей Лагранжа. Выражение расширенной целевой функции. Схема алгоритма численного решения задачи методом штрафных функций в сочетании с методом безусловной минимизации. Построение линий ограничений.
-
Поиск оптимальных решений
Основные понятия оптимизационных задач. Нахождение наибольших или наименьших значений многомерных функций в заданной области. Итерационные процессы с учетом градиента. Функционал для градиентного равенства и применение его в задачах условной оптимизации.
-
Сравнительный анализ методов оптимизации
Оптимизация как раздел математики, ее определение, сущность, цели, формулировка и особенности постановки задач. Общая характеристика различных методов математической оптимизации функции. Листинг программ основных методов решения задач оптимизации функции.