Правила ввода функций :
Дважды непрерывно дифференцируемая функция f(x) является выпуклой (вогнутой) тогда и только тогда, когда матрица Гессе функции f(x) по x положительно (отрицательно) полуопределена для всех x (см. точки локальных экстремумов функции многих переменных).
Критические точки функции:
- если гессиан положительно определён, то x 0 - точка локального минимума функции f(x) ,
- если гессиан отрицательно определён, то x 0 - точка локального максимума функции f(x) ,
- если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (det G(f) ≠ 0), то x 0 - седловая точка функции f(x).
Критерии определенности матрицы (теорема Сильвестра)
Положительная определенность :- все диагональные элементы матрицы должны быть положительны;
- все ведущие главные определители должны быть положительны.
Положительная полуопределенность:
- все диагональные элементы неотрицательны;
- все главные определители неотрицательны.
Квадратная симметрическая матрица порядка n , элементами которой являются частные производные целевой функции второго порядка, называется матрицей Гессе и обозначается:
Для того, чтобы симметрическая матрица была положительно определена, необходимо и достаточно, чтобы все ее диагональные миноры были положительны, т.е.
для матрицы A = (a ij) положительные.
Отрицательная определенность
.
Для того чтобы симметрическая матрица была отрицательно определена, необходимо и достаточно, чтобы имели место неравенства:
(-1) k D k > 0, k
=1,.., n.
Другими словами, для того, чтобы квадратичная форма была отрицательно определённой
, необходимо и достаточно, чтобы знаки угловых миноров матрицы квадратичной формы чередовались, начиная со знака минус. Например, для двух переменных, D 1 < 0, D 2 > 0.
Если гессиан полуопределен, то это может быть и точка перегиба. Нужны дополнительные исследования, которые могут быть проведены по одному из следующих вариантов:
- Понижение порядка . Делается замена переменных. Например, для функции двух переменных это y=x , в итоге получаем функцию одного переменного x . Далее исследуется поведение функции на прямых y=x и y=-x . Если в первом случае функция в исследуемой точке будет иметь минимум, а в другом случае максимум (или наоборот), то исследуемая точка представляет собой седловую точку .
- Нахождение собственных значений гессиана. Если все значения положительные, функция в исследуемой точке имеет минимум, если все отрицательные – имеется максимум.
- Исследование функции f(x) в окрестности точки ε. Переменные x заменяются на x 0 +ε. Далее необходимо доказать, что функция f(x 0 +ε) от одной переменной ε, либо больше нуля (тогда x 0 точка минимума), либо меньше нуля (тогда x 0 точка максимума).
Примечание . Чтобы найти обратный гессиан достаточно найти обратную матрицу .
Пример №1
. Какие из следующих функций являются выпуклыми или вогнутыми: f(x) = 8x 1 2 +4x 1 x 2 +5x 2 2 .
Решение
. 1. Найдем частные производные.
2. Решим систему уравнений.
-4x 1 +4x 2 +2 = 0
4x 1 -6x 2 +6 = 0
Получим:
а) Из первого уравнения выражаем x 1 и подставляем во второе уравнение:
x 2 = x 2 + 1 / 2
-2x 2 +8 = 0
Откуда x 2 = 4
Данные значения x 2 подставляем в выражение для x 1 . Получаем: x 1 = 9 / 2
Количество критических точек равно 1.
M 1 (9 / 2 ;4)
3. Найдем частные производные второго порядка.
4. Вычислим значение этих частных производных второго порядка в критических точках M(x 0 ;y 0).
Вычисляем значения для точки M 1 (9 / 2 ;4)
Строим матрицу Гессе:
D 1 = a 11 < 0, D 2 = 8 > 0
Поскольку диагональные миноры имеют различные знаки, то о выпуклости или вогнутости функции ничего сказать нельзя.
Квадратичные формы.
Знакоопределённость форм. Критерий Сильвестра
Прилагательное «квадратичный» сразу наталкивает на мысль, что что-то здесь связано с квадратом (второй степенью), и очень скоро мы узнаем это «что-то» и что такое форма. Прямо скороговоркой получилась:)
Приветствую вас на своём новом уроке, и в качестве незамедлительной разминки мы рассмотрим форму в полосочку линейную . Линейной формой переменных называют однородный многочлен 1-й степени:
– какие-то конкретные числа* (предполагаем, что хотя бы одно из них отлично от нуля) , а – переменные, которые могут принимать произвольные значения.
* В рамках данной темы будем рассматривать только действительные числа .
С термином «однородный» мы уже сталкивались на уроке об однородных системах линейных уравнений , и в данном случае он подразумевает, что у многочлена нет приплюсованной константы .
Например: – линейная форма двух переменных
Теперь форма квадратичная. Квадратичной формой переменных называют однородный многочлен 2-й степени, каждое слагаемое которого содержит либо квадрат переменной, либо парное произведение переменных. Так, например, квадратичная форма двух переменных имеет следующий вид:
Внимание!
Это стандартная запись, и что-то менять в ней не нужно! Несмотря на «страшный» вид, тут всё просто – двойные подстрочные индексы констант сигнализируют о том, какие переменные входят в то или иное слагаемое:
– в этом слагаемом находится произведение и (квадрат);
– здесь произведение ;
– и здесь произведение .
– сразу упреждаю грубую ошибку, когда теряют «минус» у коэффициента, не понимая, что он относится к слагаемому:
Иногда встречается «школьный» вариант оформления в духе , но то лишь иногда. Кстати, заметьте, что константы нам тут вообще ни о чем не говорят, и поэтому запомнить «лёгкую запись» труднее. Особенно, когда переменных больше.
И квадратичная форма трёх переменных содержит уже шесть членов:
…почему в «смешанных» слагаемых ставятся множители-«двойки»? Это удобно, и скоро станет понятно, почему.
Однако общую формулу запишем, её удобно оформить «простынёй»:
– внимательно изучаем каждую строчку – ничего страшного тут нет!
Квадратичная форма содержит слагаемых с квадратами переменных и слагаемых с их парными произведениями (см. комбинаторную формулу сочетаний ) . Больше ничего – никаких «одиноких иксов» и никакой приплюсованной константы (тогда уже получится не квадратичная форма, а неоднородный многочлен 2-й степени).
Матричная запись квадратичной формы
В зависимости от значений рассматриваемая форма может принимать как положительные, так и отрицательные значения, и то же самое касается любой линейной формы – если хотя бы один из её коэффициентов отличен от нуля, то она может оказаться как положительной, так и отрицательной (в зависимости от значений ).
Такая форма называется знакопеременной . И если с линейной формой всё прозрачно, то с формой квадратичной дела обстоят куда более интересно:
Совершенно понятно, что данная форма может принимать значения любого знака, таким образом, квадратичная форма тоже может быть знакопеременной .
А может и не быть:
– всегда, если только одновременно не равны нулю.
– для любого вектора , кроме нулевого .
И вообще, если для любого ненулевого вектора , , то квадратичную форму называют положительно определённой ; если же – то отрицательно определённой .
И всё бы было хорошо, но определённость квадратичной формы виднА лишь в простых примерах, и эта видимость теряется уже при небольшом усложнении:
– ?
Можно предположить, что форма определена положительно, но так ли это на самом деле? Вдруг существуют значения , при которых она меньше нуля?
На этот счёт существует теорема : если ВСЕ собственные числа матрицы квадратичной формы положительны* , то она определена положительно. Если все отрицательны – то отрицательно.
* В теории доказано, что все собственные числа действительной симметрической матрицы действительны
Запишем матрицу вышеприведённой формы:
и из уравнения найдём её собственные значения
:
Решаем старое доброе квадратное уравнение
:
, значит, форма определена положительно, т.е. при любых ненулевых значениях она больше нуля.
Рассмотренный метод вроде бы рабочий, но есть одно большое НО. Уже для матрицы «три на три» искать собственные числа – есть занятие долгое и неприятное; с высокой вероятностью получится многочлен 3-й степени с иррациональными корнями.
Как быть? Существует более простой путь!
Критерий Сильвестра
Нет, не Сильвестра Сталлоне:) Сначала напомню, что такое угловые миноры
матрицы. Это определители
которые «разрастаются» из её левого верхнего угла:
и последний из них в точности равен определителю матрицы.
Теперь, собственно, критерий :
1) Квадратичная форма определена положительно тогда и только тогда, когда ВСЕ её угловые миноры больше нуля: .
2) Квадратичная форма определена отрицательно тогда и только тогда, когда её угловые миноры знакочередуются, при этом 1-й минор меньше нуля: , , если – чётное или , если – нечётное.
Если хотя бы один угловой минор противоположного знака, то форма знакопеременна . Если угловые миноры «того» знака, но среди них есть нулевые, то это особый случай, который я разберу чуть позже, после того, как мы перещёлкаем более распространённые примеры.
Проанализируем угловые миноры матрицы :
И это сразу говорит нам о том, что форма не определена отрицательно.
Вывод : все угловые миноры больше нуля, значит, форма определена положительно.
Есть разница с методом собственных чисел? ;)
Запишем матрицу формы из Примера 1
:
первый её угловой минор , а второй , откуда следует, что форма знакопеременна, т.е. в зависимости от значений , может принимать как положительные, так и отрицательные значения. Впрочем, это и так очевидно.
Возьмём форму и её матрицу из Примера 2
:
тут вообще без озарения не разобраться. Но с критерием Сильвестра нам всё нипочём:
, следовательно, форма точно не отрицательна.
, и точно не положительна (т.к. все угловые миноры должны быть положительными) .
Вывод : форма знакопеременна.
Разминочные примеры для самостоятельного решения:
Пример 4
Исследовать квадратичные формы на знакоопределенность
а)
В этих примерах всё гладко (см. конец урока), но на самом деле для выполнения такого задания критерия Сильвестра может оказаться не достаточно .
Дело в том, что существуют «краевые» случаи, а именно: если для любого ненулевого вектора , то форма определена неотрицательно , если – то неположительно . У этих форм существует ненулевые векторы , при которых .
Здесь можно привести такой «баян»:
Выделяя полный квадрат , сразу видим неотрицательность формы: , причём, она равна нулю и при любом векторе с равными координатами, например: .
«Зеркальный» пример неположительно
определённой формы:
и ещё более тривиальный пример:
– здесь форма равна нулю при любом векторе , где – произвольное число.
Как выявить неотрицательность или неположительнось формы?
Для этого нам потребуется понятие главных миноров
матрицы. Главный минор – это минор, составленный из элементов, которые стоят на пересечении строк и столбцов с одинаковыми номерами. Так, у матрицы существуют два главных минора 1-го порядка:
(элемент находится на пересечении 1-й строки и 1-го столбца);
(элемент находится на пересечении 2-й строки и 2-го столбца),
и один главный минор 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца.
У матрицы «три на три» главных миноров семь, и тут уже придётся помахать бицепсами:
– три минора 1-го порядка,
три минора 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца;
– составлен из элементов 1-й, 3-й строки и 1-го, 3-го столбца;
– составлен из элементов 2-й, 3-й строки и 2-го, 3-го столбца,
и один минор 3-го порядка:
– составлен из элементов 1-й, 2-й, 3-й строки и 1-го, 2-го и 3-го столбца.
Задание
на понимание: записать все главные миноры матрицы .
Сверяемся в конце урока и продолжаем.
Критерий Шварценеггера :
1) Ненулевая* квадратичная форма определена неотрицательно тогда и только тогда, когда ВСЕ её главные миноры неотрицательны (больше либо равны нулю).
* У нулевой (вырожденной) квадратичной формы все коэффициенты равны нулю .
2) Ненулевая квадратичная форма с матрицей определена неположительно
тогда и только тогда, когда её:
– главные миноры 1-го порядка неположительны
(меньше либо равны нулю);
– главные миноры 2-го порядка неотрицательны
;
– главные миноры 3-го порядка неположительны
(пошло чередование);
…
– главный минор -го порядка неположителен
, если – нечётное либо неотрицателен
, если – чётное.
Если хотя бы один минор противоположного знака, то форма знакопеременна.
Посмотрим, как работает критерий в вышеприведённых примерах:
Составим матрицу формы, и в первую очередь
вычислим угловые миноры – а вдруг она определена положительно или отрицательно?
Полученные значения не удовлетворяют критерию Сильвестра, однако второй минор не отрицателен , и это вызывает надобность проверить 2-й критерий (в случае 2-й критерий будет не выполнен автоматически, т.е. сразу делается вывод о знакопеременности формы) .
Главные миноры 1-го порядка:
– положительны,
главный минор 2-го порядка:
– не отрицателен.
Таким образом, ВСЕ главные миноры не отрицательны, значит, форма неотрицательна .
Запишем матрицу формы , для которой, очевидно, не выполнен критерий Сильвестра. Но и противоположных знаков мы тоже не получили (т.к. оба угловых минора равны нулю). Поэтому проверяем выполнение критерия неотрицательности / неположительности. Главные миноры 1-го порядка:
– не положительны,
главный минор 2-го порядка:
– не отрицателен.
Таким образом, по критерию Шварценеггера (пункт 2), форма определена неположительно.
Теперь во всеоружии разберём более занятную задачку:
Пример 5
Исследовать квадратичную форму на знакоопределенность
Данную форму украшает орден «альфа», который может равняться любому действительному числу. Но это ж только веселее будет, решаем .
Сначала запишем матрицу формы, наверное, многие уже приноровились это делать устно: на главную диагональ
ставим коэффициенты при квадратах, а на симметричные места – споловиненные коэффициенты соответствующих «смешанных» произведений:
Вычислим угловые миноры:
третий определитель я раскрою по 3-й строке:
Квадратичной формой называется однородный многочлен 2-й степени от нескольких переменных.
Квадратичная форма от переменных состоит из слагаемых двух типов: квадратов переменных и их попарных произведений с некоторыми коэффициентами. Квадратичную форму принято записывать в виде следующей квадратной схемы:
Пары подобных членов записываются с одинаковыми коэффициентами, так что каждый из них составляет половину коэффициента при соответствующем произведении переменных. Таким образом, каждая квадратичная форма естественным образом связывается с матрицей ее коэффициентов, которая является симметричной.
Квадратичную форму удобно представлять и в следующей матричной записи. Обозначим через X столбец из переменных через X - строку т. е. матрицу, транспонированную с X. Тогда
Квадратичные формы встречаются во многих разделах математики и ее приложений.
В теории чисел и кристаллографии рассматриваются квадратичные формы в предположении, что переменные принимают только целочисленные значения. В аналитической геометрии квадратичная форма входит в состав уравнения кривой (или поверхности) порядка. В механике и физике квадратичная форма появляется для выражения кинетической энергии системы через компоненты обобщенных скоростей и т. д. Но, кроме того, изучение квадратичных форм необходимо и в анализе при изучении функций от многих переменных, в вопросах, для решения которых важно выяснить, как данная функция в окрестности данной точки отклоняется от приближающей ее линейной функции. Примером задачи этого типа является исследование функции на максимум и минимум.
Рассмотрим, например, задачу об исследовании на максимум и минимум для функции от двух переменных имеющей непрерывные частные производные до порядка. Необходимым условием для того, чтобы точка давала максимум или минимум функции является равенство нулю частных производных порядка в точке Допустим, что это условие выполнено. Придадим переменным х и у малые приращения и к и рассмотрим соответствующее приращение функции Согласно формуле Тейлора это приращение с точностью до малых высших порядков равно квадратичной форме где - значения вторых производных вычисленные в точке Если эта квадратичная форма положительна при всех значениях и к (кроме ), то функция имеет минимум в точке если отрицательна, то - максимум. Наконец, если форма принимает и положительные и отрицательные значения, то не будет ни максимума, ни минимума. Аналогичным образом исследуются и функции от большего числа переменных.
Изучение квадратичных форм в основном заключается в исследовании проблемы эквивалентности форм относительно той или другой совокупности линейных преобразований переменных. Две квадратичные формы называются эквивалентными, если одна из них может быть переведена в другую посредством одного из преобразований данной совокупности. С проблемой эквивалентности тесно связана проблема приведения формы, т. о. преобразования ее к некоторому возможно простейшему виду.
В различных вопросах, связанных с квадратичными формами, рассматриваются и различные совокупности допустимых преобразований переменных.
В вопросах анализа применяются любые неособенные преобразования переменных; для целей аналитической геометрии наибольший интерес представляют ортогональные преобразования, т. е. те, которым соответствует переход от одной системы переменных декартовых координат к другой. Наконец, в теории чисел и в кристаллографии рассматриваются линейные преобразования с целыми коэффициентами и с определителем, равным единице.
Мы рассмотрим из этих задач две: вопрос о приведении квадратичной формы К простейшему виду посредством любых неособенных преобразований и тот же вопрос для преобразований ортогональных. Прежде всего выясним, как преобразуется матрица квадратичной формы при линейном преобразовании переменных.
Пусть , где А - симметричная матрица из коэффициентов формы, X - столбец из переменных.
Сделаем линейное преобразование переменных, записав его сокращенно . Здесь С обозначает матрицу коэффициентов этого преобразования, X - столбец из новых переменных. Тогда и, следовательно, так что матрицей преобразованной квадратичной формы является
Матрица автоматически оказывается симметричной, что легко проверяется. Таким образом, задача о приведении квадратичной формы к простейшему виду равносильна задаче о приведении к простейшему виду симметричной матрицы посредством умножения ее слева и справа на взаимно транспонированные матрицы.