Квадратичная форма в матричном виде. Положительно определенные квадратичные формы

Назначение сервиса . Онлайн-калькулятор используется для нахождения матрицы Гессе и определения вида функции (выпуклая или вогнутая) (см. пример). Решение оформляется в формате Word . Для функции одной переменной f(x) определяются интервалы выпуклости и вогнутости .

f(x 1 ,x 2 ,x 3) =

Находить в точке X 0: x 1 = , x 2 = , x 3 =

Правила ввода функций :

Дважды непрерывно дифференцируемая функция f(x) является выпуклой (вогнутой) тогда и только тогда, когда матрица Гессе функции f(x) по x положительно (отрицательно) полуопределена для всех x (см. точки локальных экстремумов функции многих переменных).

Критические точки функции:

  • если гессиан положительно определён, то x 0 - точка локального минимума функции f(x) ,
  • если гессиан отрицательно определён, то x 0 - точка локального максимума функции f(x) ,
  • если гессиан не является знакоопределённым (принимает как положительные, так и отрицательные значения) и невырожден (det G(f) ≠ 0), то x 0 - седловая точка функции f(x).

Критерии определенности матрицы (теорема Сильвестра)

Положительная определенность :
  • все диагональные элементы матрицы должны быть положительны;
  • все ведущие главные определители должны быть положительны.
Для положительно полуопределённых матриц критерий Сильвестра звучит подобным образом: Форма положительно полуопределена тогда и только тогда, когда все главные миноры неотрицательны. Если матрица Гессе в точке положительно полуопределена (все главные миноры неотрицательные), то это точка минимума (однако, если гессиан полуопределен, а один из миноров равен 0, то это может быть и седловая точка. Нужны дополнительные проверки).

Положительная полуопределенность:

  • все диагональные элементы неотрицательны;
  • все главные определители неотрицательны.
Главный определитель – это определитель главного минора.

Квадратная симметрическая матрица порядка n , элементами которой являются частные производные целевой функции второго порядка, называется матрицей Гессе и обозначается:

Для того, чтобы симметрическая матрица была положительно определена, необходимо и достаточно, чтобы все ее диагональные миноры были положительны, т.е.


для матрицы A = (a ij) положительные.

Отрицательная определенность .
Для того чтобы симметрическая матрица была отрицательно определена, необходимо и достаточно, чтобы имели место неравенства:
(-1) k D k > 0, k =1,.., n.
Другими словами, для того, чтобы квадратичная форма была отрицательно определённой , необходимо и достаточно, чтобы знаки угловых миноров матрицы квадратичной формы чередовались, начиная со знака минус. Например, для двух переменных, D 1 < 0, D 2 > 0.

Если гессиан полуопределен, то это может быть и точка перегиба. Нужны дополнительные исследования, которые могут быть проведены по одному из следующих вариантов:

  1. Понижение порядка . Делается замена переменных. Например, для функции двух переменных это y=x , в итоге получаем функцию одного переменного x . Далее исследуется поведение функции на прямых y=x и y=-x . Если в первом случае функция в исследуемой точке будет иметь минимум, а в другом случае максимум (или наоборот), то исследуемая точка представляет собой седловую точку .
  2. Нахождение собственных значений гессиана. Если все значения положительные, функция в исследуемой точке имеет минимум, если все отрицательные – имеется максимум.
  3. Исследование функции f(x) в окрестности точки ε. Переменные x заменяются на x 0 +ε. Далее необходимо доказать, что функция f(x 0 +ε) от одной переменной ε, либо больше нуля (тогда x 0 точка минимума), либо меньше нуля (тогда x 0 точка максимума).

Примечание . Чтобы найти обратный гессиан достаточно найти обратную матрицу .

Пример №1 . Какие из следующих функций являются выпуклыми или вогнутыми: f(x) = 8x 1 2 +4x 1 x 2 +5x 2 2 .
Решение . 1. Найдем частные производные.


2. Решим систему уравнений.
-4x 1 +4x 2 +2 = 0
4x 1 -6x 2 +6 = 0
Получим:
а) Из первого уравнения выражаем x 1 и подставляем во второе уравнение:
x 2 = x 2 + 1 / 2
-2x 2 +8 = 0
Откуда x 2 = 4
Данные значения x 2 подставляем в выражение для x 1 . Получаем: x 1 = 9 / 2
Количество критических точек равно 1.
M 1 (9 / 2 ;4)
3. Найдем частные производные второго порядка.



4. Вычислим значение этих частных производных второго порядка в критических точках M(x 0 ;y 0).
Вычисляем значения для точки M 1 (9 / 2 ;4)



Строим матрицу Гессе:

D 1 = a 11 < 0, D 2 = 8 > 0
Поскольку диагональные миноры имеют различные знаки, то о выпуклости или вогнутости функции ничего сказать нельзя.

Квадратичные формы.
Знакоопределённость форм. Критерий Сильвестра

Прилагательное «квадратичный» сразу наталкивает на мысль, что что-то здесь связано с квадратом (второй степенью), и очень скоро мы узнаем это «что-то» и что такое форма. Прямо скороговоркой получилась:)

Приветствую вас на своём новом уроке, и в качестве незамедлительной разминки мы рассмотрим форму в полосочку линейную . Линейной формой переменных называют однородный многочлен 1-й степени:

– какие-то конкретные числа* (предполагаем, что хотя бы одно из них отлично от нуля) , а – переменные, которые могут принимать произвольные значения.

* В рамках данной темы будем рассматривать только действительные числа .

С термином «однородный» мы уже сталкивались на уроке об однородных системах линейных уравнений , и в данном случае он подразумевает, что у многочлена нет приплюсованной константы .

Например: – линейная форма двух переменных

Теперь форма квадратичная. Квадратичной формой переменных называют однородный многочлен 2-й степени, каждое слагаемое которого содержит либо квадрат переменной, либо парное произведение переменных. Так, например, квадратичная форма двух переменных имеет следующий вид:

Внимание! Это стандартная запись, и что-то менять в ней не нужно! Несмотря на «страшный» вид, тут всё просто – двойные подстрочные индексы констант сигнализируют о том, какие переменные входят в то или иное слагаемое:
– в этом слагаемом находится произведение и (квадрат);
– здесь произведение ;
– и здесь произведение .

– сразу упреждаю грубую ошибку, когда теряют «минус» у коэффициента, не понимая, что он относится к слагаемому:

Иногда встречается «школьный» вариант оформления в духе , но то лишь иногда. Кстати, заметьте, что константы нам тут вообще ни о чем не говорят, и поэтому запомнить «лёгкую запись» труднее. Особенно, когда переменных больше.

И квадратичная форма трёх переменных содержит уже шесть членов:

…почему в «смешанных» слагаемых ставятся множители-«двойки»? Это удобно, и скоро станет понятно, почему.

Однако общую формулу запишем, её удобно оформить «простынёй»:


– внимательно изучаем каждую строчку – ничего страшного тут нет!

Квадратичная форма содержит слагаемых с квадратами переменных и слагаемых с их парными произведениями (см. комбинаторную формулу сочетаний ) . Больше ничего – никаких «одиноких иксов» и никакой приплюсованной константы (тогда уже получится не квадратичная форма, а неоднородный многочлен 2-й степени).

Матричная запись квадратичной формы

В зависимости от значений рассматриваемая форма может принимать как положительные, так и отрицательные значения, и то же самое касается любой линейной формы – если хотя бы один из её коэффициентов отличен от нуля, то она может оказаться как положительной, так и отрицательной (в зависимости от значений ).

Такая форма называется знакопеременной . И если с линейной формой всё прозрачно, то с формой квадратичной дела обстоят куда более интересно:

Совершенно понятно, что данная форма может принимать значения любого знака, таким образом, квадратичная форма тоже может быть знакопеременной .

А может и не быть:

– всегда, если только одновременно не равны нулю.

– для любого вектора , кроме нулевого .

И вообще, если для любого ненулевого вектора , , то квадратичную форму называют положительно определённой ; если же – то отрицательно определённой .

И всё бы было хорошо, но определённость квадратичной формы виднА лишь в простых примерах, и эта видимость теряется уже при небольшом усложнении:
– ?

Можно предположить, что форма определена положительно, но так ли это на самом деле? Вдруг существуют значения , при которых она меньше нуля?

На этот счёт существует теорема : если ВСЕ собственные числа матрицы квадратичной формы положительны* , то она определена положительно. Если все отрицательны – то отрицательно.

* В теории доказано, что все собственные числа действительной симметрической матрицы действительны

Запишем матрицу вышеприведённой формы:
и из уравнения найдём её собственные значения :

Решаем старое доброе квадратное уравнение :

, значит, форма определена положительно, т.е. при любых ненулевых значениях она больше нуля.

Рассмотренный метод вроде бы рабочий, но есть одно большое НО. Уже для матрицы «три на три» искать собственные числа – есть занятие долгое и неприятное; с высокой вероятностью получится многочлен 3-й степени с иррациональными корнями.

Как быть? Существует более простой путь!

Критерий Сильвестра

Нет, не Сильвестра Сталлоне:) Сначала напомню, что такое угловые миноры матрицы. Это определители которые «разрастаются» из её левого верхнего угла:

и последний из них в точности равен определителю матрицы.

Теперь, собственно, критерий :

1) Квадратичная форма определена положительно тогда и только тогда, когда ВСЕ её угловые миноры больше нуля: .

2) Квадратичная форма определена отрицательно тогда и только тогда, когда её угловые миноры знакочередуются, при этом 1-й минор меньше нуля: , , если – чётное или , если – нечётное.

Если хотя бы один угловой минор противоположного знака, то форма знакопеременна . Если угловые миноры «того» знака, но среди них есть нулевые, то это особый случай, который я разберу чуть позже, после того, как мы перещёлкаем более распространённые примеры.

Проанализируем угловые миноры матрицы :

И это сразу говорит нам о том, что форма не определена отрицательно.

Вывод : все угловые миноры больше нуля, значит, форма определена положительно.

Есть разница с методом собственных чисел? ;)

Запишем матрицу формы из Примера 1 :

первый её угловой минор , а второй , откуда следует, что форма знакопеременна, т.е. в зависимости от значений , может принимать как положительные, так и отрицательные значения. Впрочем, это и так очевидно.

Возьмём форму и её матрицу из Примера 2 :

тут вообще без озарения не разобраться. Но с критерием Сильвестра нам всё нипочём:
, следовательно, форма точно не отрицательна.

, и точно не положительна (т.к. все угловые миноры должны быть положительными) .

Вывод : форма знакопеременна.

Разминочные примеры для самостоятельного решения:

Пример 4

Исследовать квадратичные формы на знакоопределенность

а)

В этих примерах всё гладко (см. конец урока), но на самом деле для выполнения такого задания критерия Сильвестра может оказаться не достаточно .

Дело в том, что существуют «краевые» случаи, а именно: если для любого ненулевого вектора , то форма определена неотрицательно , если – то неположительно . У этих форм существует ненулевые векторы , при которых .

Здесь можно привести такой «баян»:

Выделяя полный квадрат , сразу видим неотрицательность формы: , причём, она равна нулю и при любом векторе с равными координатами, например: .

«Зеркальный» пример неположительно определённой формы:

и ещё более тривиальный пример:
– здесь форма равна нулю при любом векторе , где – произвольное число.

Как выявить неотрицательность или неположительнось формы?

Для этого нам потребуется понятие главных миноров матрицы. Главный минор – это минор, составленный из элементов, которые стоят на пересечении строк и столбцов с одинаковыми номерами. Так, у матрицы существуют два главных минора 1-го порядка:
(элемент находится на пересечении 1-й строки и 1-го столбца);
(элемент находится на пересечении 2-й строки и 2-го столбца),

и один главный минор 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца.

У матрицы «три на три» главных миноров семь, и тут уже придётся помахать бицепсами:
– три минора 1-го порядка,
три минора 2-го порядка:
– составлен из элементов 1-й, 2-й строки и 1-го, 2-го столбца;
– составлен из элементов 1-й, 3-й строки и 1-го, 3-го столбца;
– составлен из элементов 2-й, 3-й строки и 2-го, 3-го столбца,
и один минор 3-го порядка:
– составлен из элементов 1-й, 2-й, 3-й строки и 1-го, 2-го и 3-го столбца.
Задание на понимание: записать все главные миноры матрицы .
Сверяемся в конце урока и продолжаем.

Критерий Шварценеггера :

1) Ненулевая* квадратичная форма определена неотрицательно тогда и только тогда, когда ВСЕ её главные миноры неотрицательны (больше либо равны нулю).

* У нулевой (вырожденной) квадратичной формы все коэффициенты равны нулю .

2) Ненулевая квадратичная форма с матрицей определена неположительно тогда и только тогда, когда её:
– главные миноры 1-го порядка неположительны (меньше либо равны нулю);
– главные миноры 2-го порядка неотрицательны ;
– главные миноры 3-го порядка неположительны (пошло чередование);

– главный минор -го порядка неположителен , если – нечётное либо неотрицателен , если – чётное.

Если хотя бы один минор противоположного знака, то форма знакопеременна.

Посмотрим, как работает критерий в вышеприведённых примерах:

Составим матрицу формы, и в первую очередь вычислим угловые миноры – а вдруг она определена положительно или отрицательно?

Полученные значения не удовлетворяют критерию Сильвестра, однако второй минор не отрицателен , и это вызывает надобность проверить 2-й критерий (в случае 2-й критерий будет не выполнен автоматически, т.е. сразу делается вывод о знакопеременности формы) .

Главные миноры 1-го порядка:
– положительны,
главный минор 2-го порядка:
– не отрицателен.

Таким образом, ВСЕ главные миноры не отрицательны, значит, форма неотрицательна .

Запишем матрицу формы , для которой, очевидно, не выполнен критерий Сильвестра. Но и противоположных знаков мы тоже не получили (т.к. оба угловых минора равны нулю). Поэтому проверяем выполнение критерия неотрицательности / неположительности. Главные миноры 1-го порядка:
– не положительны,
главный минор 2-го порядка:
– не отрицателен.

Таким образом, по критерию Шварценеггера (пункт 2), форма определена неположительно.

Теперь во всеоружии разберём более занятную задачку:

Пример 5

Исследовать квадратичную форму на знакоопределенность

Данную форму украшает орден «альфа», который может равняться любому действительному числу. Но это ж только веселее будет, решаем .

Сначала запишем матрицу формы, наверное, многие уже приноровились это делать устно: на главную диагональ ставим коэффициенты при квадратах, а на симметричные места – споловиненные коэффициенты соответствующих «смешанных» произведений:

Вычислим угловые миноры:

третий определитель я раскрою по 3-й строке:

Квадратичной формой называется однородный многочлен 2-й степени от нескольких переменных.

Квадратичная форма от переменных состоит из слагаемых двух типов: квадратов переменных и их попарных произведений с некоторыми коэффициентами. Квадратичную форму принято записывать в виде следующей квадратной схемы:

Пары подобных членов записываются с одинаковыми коэффициентами, так что каждый из них составляет половину коэффициента при соответствующем произведении переменных. Таким образом, каждая квадратичная форма естественным образом связывается с матрицей ее коэффициентов, которая является симметричной.

Квадратичную форму удобно представлять и в следующей матричной записи. Обозначим через X столбец из переменных через X - строку т. е. матрицу, транспонированную с X. Тогда

Квадратичные формы встречаются во многих разделах математики и ее приложений.

В теории чисел и кристаллографии рассматриваются квадратичные формы в предположении, что переменные принимают только целочисленные значения. В аналитической геометрии квадратичная форма входит в состав уравнения кривой (или поверхности) порядка. В механике и физике квадратичная форма появляется для выражения кинетической энергии системы через компоненты обобщенных скоростей и т. д. Но, кроме того, изучение квадратичных форм необходимо и в анализе при изучении функций от многих переменных, в вопросах, для решения которых важно выяснить, как данная функция в окрестности данной точки отклоняется от приближающей ее линейной функции. Примером задачи этого типа является исследование функции на максимум и минимум.

Рассмотрим, например, задачу об исследовании на максимум и минимум для функции от двух переменных имеющей непрерывные частные производные до порядка. Необходимым условием для того, чтобы точка давала максимум или минимум функции является равенство нулю частных производных порядка в точке Допустим, что это условие выполнено. Придадим переменным х и у малые приращения и к и рассмотрим соответствующее приращение функции Согласно формуле Тейлора это приращение с точностью до малых высших порядков равно квадратичной форме где - значения вторых производных вычисленные в точке Если эта квадратичная форма положительна при всех значениях и к (кроме ), то функция имеет минимум в точке если отрицательна, то - максимум. Наконец, если форма принимает и положительные и отрицательные значения, то не будет ни максимума, ни минимума. Аналогичным образом исследуются и функции от большего числа переменных.

Изучение квадратичных форм в основном заключается в исследовании проблемы эквивалентности форм относительно той или другой совокупности линейных преобразований переменных. Две квадратичные формы называются эквивалентными, если одна из них может быть переведена в другую посредством одного из преобразований данной совокупности. С проблемой эквивалентности тесно связана проблема приведения формы, т. о. преобразования ее к некоторому возможно простейшему виду.

В различных вопросах, связанных с квадратичными формами, рассматриваются и различные совокупности допустимых преобразований переменных.

В вопросах анализа применяются любые неособенные преобразования переменных; для целей аналитической геометрии наибольший интерес представляют ортогональные преобразования, т. е. те, которым соответствует переход от одной системы переменных декартовых координат к другой. Наконец, в теории чисел и в кристаллографии рассматриваются линейные преобразования с целыми коэффициентами и с определителем, равным единице.

Мы рассмотрим из этих задач две: вопрос о приведении квадратичной формы К простейшему виду посредством любых неособенных преобразований и тот же вопрос для преобразований ортогональных. Прежде всего выясним, как преобразуется матрица квадратичной формы при линейном преобразовании переменных.

Пусть , где А - симметричная матрица из коэффициентов формы, X - столбец из переменных.

Сделаем линейное преобразование переменных, записав его сокращенно . Здесь С обозначает матрицу коэффициентов этого преобразования, X - столбец из новых переменных. Тогда и, следовательно, так что матрицей преобразованной квадратичной формы является

Матрица автоматически оказывается симметричной, что легко проверяется. Таким образом, задача о приведении квадратичной формы к простейшему виду равносильна задаче о приведении к простейшему виду симметричной матрицы посредством умножения ее слева и справа на взаимно транспонированные матрицы.